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内 容 简介 


本 书 是 为 “数据 结构 ”课程 编写 的 教材 ， 共 9 章 ， 系 统 介绍 了 各 种 常用 的 数据 结构 与 算法 方面 的 基本 
知识 。 第 1 章 为 绪论 ， 引 入 了 数据 结构 与 算法 的 一 些 基本 概念 ， 第 2 一 7 章 分 别 介绍 了 线性 表 、 栈 、 队 列 、 


本 书 引 入 的 主要 


图 等 几 种 基本 的 数据 结构 ; 第 8 章 和 第 9 章 分 别 介绍 了 多 种 查找 和 排序 的 算法 。 
案例 都 源 自 实 际 项 目 应 用 ， 案 例 、 项 目 由 企业 工程 师 根 据 章节 内 容 设计 并 实现 ， 全 部 


程序 都 在 C Free 5.0 中 调试 通过 。 
本 书 可 以 作为 高 等 院 校 计 算 机 、 软 件 工程 等 相关 专业 本 科学 生 的 教材 ， 也 可 以 作为 其 他 理工 科 专业 的 
选修 教材 , 还 可 供 从 事 计算 机 应 用 的 工程 技术 人 员 参 考 , 读者 只 需 掌握 C 语言 编程 的 基本 技术 就 可 以 学 习 
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信息 技术 的 案例 型 教材 建设 


RAB) 
刘 瑞 挺 


北京 大 学 出 版 社 第 六 事业 部 在 2005 年 组 织 编写 了 《21 世纪 全 国 应 用 型 本 科 计算 机 系 
列 实用 规划 教材 》， 至 今 已 出 版 了 50 多 种 。 这 些 教材 出 版 后 ， 在 全 国 高 校 引起 热烈 反响 ， 
可 谓 初战 告捷 。 这 使 北京 大 学 出 版 社 的 计算 机 教材 市 场 规模 迅速 扩大 , 编辑 队伍 基 壮 成 长 ， 
经 济 效 益 明显 增强 ， 与 各 类 高 校 师 生 的 关系 更 加 密切 。 
2008 年 1 月 北京 大 学 出 版 社 第 六 事业 部 在 北京 召开 了 “21 世纪 全 国 应 用 型 本 科 计 算 机 
案例 型 教材 建设 和 教学 研讨 会 "。 这 次 会 议 为 编写 案例 型 教材 做 了 深入 的 探讨 和 具体 的 部 
署 ， 制 定 了 详细 的 编写 目的 、 从 书 特 色 、 内 容 要 求 和 风格 规范 。 在 内 容 上 强调 面向 应 用 、 
能 力 驱动 、 精 选 案例 、 严 把 质量 ; 在 风格 上 力求 文字 精练 IKER 晰 、 图 表明 快 、 版 式 新 
蜂 。 这 次 会 议 吹 响 了 所 高教 村 质量 第 二 战役 的 进军 号 S 

案例 型 教材 真能 提高 教学 的 质量 吗 ? oe 

是 的 。 著 名 法 国 哲学 家 、 数 学 家 勒 内 。 AEE Jb(Rene Descartes, 1596—1650) ili #4 
好 :“ 由 一 个 例子 的 考察 ， 我 们 可 以 抽出 一 规律 (From the consideration of an example we 
can form a rule)” WKE, 他 发 明 的 直 朋 华 RA, ， 正 是 通过 生活 实例 而 得 到 的 灵感 。 据 说 
是 在 1619 年 夏天 ， 笛 卡 儿 因 病 住 进 医院 \ 息 午 他 躺 在 病床 上 ， 蔡 苦 思索 一 个 数学 问题 时 ， 
忽然 看 到 天 花 板 上 有 一 只 苍蝇 飞 来 去 。 当时 天 花 板 是 用 林 条 做 成 正方 形 的 格子 。 笛 卡 儿 
发 现 ， 要 说 出 这 只 苍蝇 在 天 花 板 土 的 位 置 ， 只 需 说 出 若 蝇 在 天 花 板 上 的 第 几 行 和 第 几 列 。 
当 苍 蝇 落 在 第 四 行 、 第 : 列 的 个 正方 形 时 ， 可 以 用 (47 5) 来 表示 这 个 位 置 …… 由 此 他 联 
想到 可 用 类 似 的 办 法 来 描 一 个 上 在 平面 上 的 位 置 : 他 高 兴 地 跳 下 床 ， 喊 着 “我 找到 了 ， 
找到 了 ”, 然而 不 小 已 把 国际 象棋 撤 了 一 地 s 当 他 的 目光 落 到 棋盘 上 时 , 又 兴奋 地 一 拍 大 腿 : 
“对 ， 对 ， 就 是 这 从 图 ”。 币 卡 儿 负 而 不 合 的 台 力 ， 苦 思 和 冥想 的 钻研 ， 使 他 开创 了 解析 几何 
的 新 纪元 。 千 百年 来 ， 代 数 与 几何 ， 井 水 不 犯 河水 。17 世纪 后 ， 数 学 突飞猛进 的 发 展 ， 在 
很 大 程度 上 归功 于 笛 卡 儿 坐标 系 和 解析 几何 学 的 创立 。 
这 个 故事 ， 听 起 来 与 阿 基 米 德 在 浴缸 洗澡 而 发 现 浮力 原理 ， 牛 顿 在 苹果 树 下 遇 到 苹果 
落 到 头 上 而 发 现 万 有 引力 定律 ， 确 有 异曲同工 之 妙 。 这 就 证 明 ， 一 个 好 的 例子 往往 能 激发 
灵感 ， 由 特殊 到 一 般 ， 联 想 出 普遍 的 规律 ， 即 所 谓 的 “一 叶 知 秋 ”“ 见 微 知 著 ”的 意思 。 
可 顾 计算 机 发 明 的 历史 ， 每 一 台 机 器 、 每 一 颗 芯 片 、 每 一 种 操作 系统 、 每 一 类 编程 语 
言 、 每 一 个 算法 、 每 一 套 软件 、 每 一 款 外 部 设备 ， 无 不 像 办 光 的 珍珠 串 在 一 起 。 每 个 案例 
都 闪烁 着 智慧 的 火花 ， 是 创新 思想 不 竭 的 源泉 。 在 计算 机 科学 技术 领域 ， 这 样 的 案例 就 像 
大 海岸 边 的 贝壳 ， 俯 拾 皆 是 。 

事实 上 , 案例 研究 (Case Study) 是 现代 科学 广泛 使 用 的 一 种 方法 。 Case 包含 的 意义 很 广 : 
包括 Example 例子 ，Instance 事例 、 示 例 ，Actual State 实际 状况 ，Circumstance 情况 、 事 件 、 
境遇 ， 甚 至 Project 项 目 、 工 程 等 。 

我 们 知道 在 计算 机 的 科学 术语 中 ,很 多 是 直接 来 自 日 常生 活 的 。 例 如 Computer 一 词 早 
在 1646 年 就 出 现 于 古代 英文 字典 中 ， 但 当时 它 的 意义 不 是 “计算 机 ”而 是 “计算 工人 ”， 
即 专门 从 事 简 单 计算 的 工人 。 同 理 ，Printer 当时 也 是 “印刷 工人 ”而 不 是 “打印 机 ”。 正 是 






































































































































数据 结构 (C 语言 版 ) ( ”) 


于 这 些 “ 计 算 工 人 ”和 “印刷 工人 ” 常 出 现 计 算 错误 和 印刷 错误 ， 才 激发 查尔斯 。 巴 贝 
奇 (Charles Babbage，1791 一 1871) 设 计 了 差分 机 和 分 析 机 ， 这 是 最 早 的 专用 计算 机 和 通用 计 
算 机 。 这 位 英国 剑桥 大 学 数学 教授 、 机 械 设计 专家 、 经 济 学 家 和 哲学 家 是 国际 公认 的 “ 计 
算 机 之 父 ”。 

20 世纪 40 年 代 ， 人 们 还 用 Calculator 表示 计算 机 器 。 到 电子 计算 机 出 现 后 ， 才 | 
Computer 表示 计算 机 。 此 外 ， 硬 件 (Hardware) 和 软件 (Software) 来 自 销售 人 员 。 总 线 (Bus) 
就 是 公共 汽车 或 大 巴 ， 故 障 和 排除 故障 源 自 格 瑞 斯 。 霍 普 (Grace Hopper，1906 一 1992) 发 现 
的 “ 飞 蛾 子 ”(Bug) 和 “ 抓 蛾 子 ”或 “ 抓 虫子 ”(Debug)。 其 他 如 鼠标 、 菜 单 …… 不 胜 枚 举 
至 于 哲学 家 进餐 问题 ， 理 发 师 睡觉 问题 更 是 操作 系统 文化 中 脸 久 人 口 的 经 典 。 

以 计算 机 为 核心 的 信息 技术 ， 从 一 开始 就 与 应 用 紧密 结合 。 例 如 ，ENIAC 用 于 弹道 
线 的 计算 ，ARPANET 用 于 资源 共享 以 及 核 战争 时 的 可 靠 通信 。 即 使 是 非常 抽象 的 图 灵 忆 
模型 ， 也 受益 于 二 战 时 图 灵 博 士 破译 纳粹 密码 工作 的 关系 。 

在 信息 技术 中 ， 既 有 许多 成 功 的 案例 ， 也 有 不 少 失 T e 
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案例 ， 也 有 先 失败 而 后 成 功 的 案例 。 好 好 研究 它们 的 成 失败 教训 ， 对 于 编写 案例 
型 教材 有 重要 的 意义 。 
我 国正 在 实现 中 华 民族 的 伟大 复兴 , 教育 是 改革 开放 30 年 来 , 我 国 

















高 等 教育 在 数量 上 、 规 模 上 已 有 相当 的 发 展 必 当 peheineetinenieman 
a EAEE E E 养 、 应 当 指出 ， 大 学 课堂 在 高 新 技术 的 武装 下 
利用 PPT 进行 的 “高 速 灌输 ”“ 翻 页 宣 笠 ey 我 们 不 能 容忍 用 “技术 ” 
绑架 教学 ta neem 

本 系列 教材 的 编写 ， 以 学 全 就 业 所 需 的 专业 知识 和 操作 技能 为 着 眼 点 ， 在 适度 的 基础 
知识 与 理论 体系 覆盖 下 突出 应 用 型 、 技 能 型 Sem att, 强化 案例 教学 。 
本 套 教材 将 会 有 机 融入 天 量 最 新 的 示例 、 anne 性 较 强 的 案例 ， 力 求 提高 教材 的 趣 
味 性 和 实用 性 ， 打 破 igre: 性 ， 强 化 实际 操作 的 训练 ， 使 本 系列 教 
材 做 到 “教师 易 教 ， 学 生 乐 学 ， 技 能 实 ORT AARNE, Bit RRM 
就 有 了 基础 。 

我 相信 北京 大 学 出 版 社 在 全 国 各 地 高 校 教师 的 积极 支持 下 ， 精 心 设计 ， 严 格 把 关 ， 一 
定 能 够 建设 出 一 批 符合 计算 机 应 用 型 人 才 培 养 模式 的 、 以 案例 型 为 创新 点 和 兴奋 点 的 精品 
教材 ， 并 且 通过 一 体 化 设计 、 实 现 多 种 媒体 有 机 结合 的 立体 化 教材 ， 为 各 门 计算 机 课程 配 
齐 电子 教案 、 学 习 指导 、 习 题解 答 、 课 程 设计 等 辅导 资料 。 让 我 们 用 钦 而 不 售 的 才 力 ， 勤 
奋 好 学 的 钻研 ， 向 着 共同 的 目标 努力 吧 ! 



















































































刘 瑞 挺 教 授 ”本 系列 教材 编写 指导 委员 会 主任 、 全 国 高 等 院 校 计算 机 基础 教育 研究 会 副 会 长 、 中 国 计 
算 机 学 会 普及 工作 委员 会 顾问 、 教育 部 考试 中 心 全 国 计 算 机 应 用 技术 证 书 考试 委员 会 副 主任 、 全国 计 算 机 
等 级 考试 顾问 . 曾 任 教育 部 理科 计算 机 科学 教学 指导 委员 会 委员 、 中 国 计 算 机 学 会 教育 培训 委员 会 副 主 任 。 
PC Magazine《 个 人 电脑 》 总 编辑 、CHIP《 新 电脑 》 总 顾问 、 清 华 大 学 《计算 机 教育 》 总 策划 。 
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数据 结构 是 计算 机 科学 中 最 重要 的 课程 之 一 ， 是 计算 机 科学 的 算法 理论 基础 和 程序 设 

















计 的 技术 基础 ， 因 此 ， 数 据 结构 是 计算 机 及 其 相关 专业 的 一 门 核心 课程 。 








对 于 初学 者 ， 数 据 结构 的 学 习 有 两 大 难题 : 一 是 抽象 的 数据 结构 原理 与 方法 难以 理解 


并 掌握 ， 二 是 难以 用 抽象 的 原理 与 方法 来 解决 实际 问题 。 一 般 数据 结构 书籍 使 用 伪 代 码 ， 


提供 完整 算法 ， 给 初学 者 带 来 不 便 。 本 书 每 章 的 内 容 通过 一 个 实际 项 目 来 引入 ， 结 合理 


论 知 识 ， 把 项 目 进行 完整 的 实现 ， 将 抽象 的 原理 、 方法 与 实践 紧密 结合 ， 加 深 了 读者 对 数 
据 结 构 和 算法 的 理解 ， 从 而 提高 读者 的 编程 能 7 


业 
节 内 








丁 海 涛 及 杭州 | iy FEIL 及 浙 





本 书 引入 的 主要 案例 都 源 自 实际 项 目 应 用 ， 本 书 编 才 由 来 自学 校 的 教师 和 来 自 企 

的 工程 师 组 成 。 理 论 算法 和 文字 内 容 由 学 校 教师 缩 iS a 、 项 目 由 企业 工程 师 根据 章 
容 设 计 并 实现 ， 全 部 程序 都 在 C Free 5.0 中 调 

本 书 共 9 章 。 第 1 章 为 绪论 : 第 2 一 4 章 分 线性 表 、 栈 、 队 列 和 串 等 几 种 基本 











4 数据 结构 ， 都 属于 线性 结构 ; 第 5 一 7 Hs 绍 了 多 维 数组 、 树 和 图 等 非 线性 结构 ; 第 
8 章 和 第 9 ee e 的 技术 。 





ne 程 中 ， 得 到 了 亚信 科技 杭州 研发 中 心 的 张 继 洲 、 
Ce 浙 


江 树 人 大 学 陈 超 祥 老师 编写 了 第 1、2 章 ， 学 李 文 书 老师 编写 了 第 3、4 章 ， 浙 
江 树 人 大 学 刘 静 静 老 师 编写 子 第 5、6 章 ， 浙 江 学 徐 萍 老师 编写 了 第 7、8、9 章 。 本 


书 








主要 项 目 由 浙大 el BARDIN 、 章 治 两 位 工程 师 设计 完成 。 全 书 最 
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日 陈 超 祥 、 师 统 稿 。 本 书 的 编写 得 到 了 浙大 网 新 科技 股份 有 限 公 AN 司 赵 育 新 总 监 、 
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PA ansa 
学 生 信息 查询 问题 


某 学 校 要 开发 一 个 查询 某 个 学 生 信息 的 程序 。 RAs PEI 个 学 生 学 号 ， 若 
该 学 号 存在 ， 则 迅速 找到 其 姓名 、 性 别 、 专 业 、 “联系 方式 等 信息 ， 否 则 指出 没有 该 
学 号 的 学 生 。 


1.1 本 


在 计算 机 发 展 初期 ， 人 们 民用 计算 机 主要 是 处 理 数值 计算 问题 ， 所 涉及 的 运算 对 象 是 
简单 的 整 型 、 实 型 或 布尔 型 数据 ， 所 以 程序 设计 者 的 主要 精力 集中 于 程序 设计 的 技巧 上 ， 
而 无 需 重视 数据 结构 。 傅 着 计算 机 软 、 硬 件 的 发 展 和 应 用 领域 的 扩大 ， 非 数值 计算 问题 越 
来 越 多 ， 越 来 越 重要 -这 类 问题 涉及 的 数据 对 象 更 为 复杂 ， 数 据 元 素 之 问 的 相互 关系 一 般 
无 法 用 数学 方程 式 加 以 描述 。 因 此 ， 在 计算 机 中 如 何 有 效 地 组 织 和 处 理 数据 就 成 了 人 迫切 需 
要 解决 的 问题 。 

1， 解 决 问题 的 方法 

在 编写 查找 学 生 信息 的 程序 (本 书 使 用 C 语言 ) 时 ， 一 般 会 经 历 如 下 几 个 步 又 。 

(1) 构造 一 张 学 生 信息 表 ( 即 数 据 结构 )。 表 中 每 个 节点 存放 以 下 数据 项 ， 学 号 、 姓 名 、 
性 别 、 专 业 班级 、 联 系 方式 ， 如 表 1.1 所 示 。 


R11 某 高 校 学 生 信 息 表 
专业 班级 
















联系 方式 

















201105215101 计算 机 应 用 111 班 | 88222222 
201105215223 计算 机 应 用 112 BE | 13958111111 
201105214110 电子 信息 工程 111 班 | 13779000000 










201105216125 电子 商务 111 班 13738555555 
(2) 将 学 生 信息 表 存 储 到 计算 机 中 ， 即 确定 存储 结构 。 可 以 先 定 义 一 个 C 语言 的 结构 
体 类 型 ， 如 下 所 示 。 





数据 结构 (C 语言 版 ) 


typedef struct 

{ 
char number[12]; 
char name[10]; 
char sex; 
char class[20]; 


char relation[12]; 


















}StudentInfo; 
再 选择 一 维 数组 来 储存 学 生 的 信息 ， 该 数组 的 存储 结构 如 图 1.1 所 示 。 
stu[0] 201105215101 | 许 林 | 男 | 计算 机 应 用 111 班 88222222 
stu[1] 201105215223 李志强 | 男 计算 机 应 用 112 班 ”。 13958111111 
stu[2] 201105214110 女 由 子 信息 下 程 1U 亚 2 13779000000 










stu[3] 201105216125 13738555555 














图 1.1 学 生 信息 表 的 顺序 存储 结构 示意 图 
(3) 确定 算法 。 根 据 问题 的 要 求 ， 确 定 实现 查找 的 算法 。 算 法 的 实现 是 根据 存储 结构 


决定 的 ， 如 果 将 学 生 信息 表 数据 顺序 地 存储 在 计算 机 中 ， 则 本 例 将 从 头 开始 依次 查找 学 生 
学 号 ， 直 到 找 出 与 之 对 应 的 学 号 ,然后 再 将 其 对 应 学 生 的 信息 显示 出 来 。 

(4) 根据 算法 ， 写 出 实现 问题 的 代码 。 

2. 分 析 kK 

在 上 面 例 子 中 ,用 数组 存储 了 学 生 信息 表 、 数 组 决定 了 计算 机 存储 的 学 生 信息 的 最 大 
个 数 是 固定 的 ， 这 不 符合 实际 的 使 用 情况 ; 数组 在 内 存 中 顺序 存储 决定 了 逻辑 上 相 邻 的 数 
据 元 素 在 物理 位 置 止 也 相 邻 。 因 此 ， 在 顺序 结构 中 查找 任何 一 个 位 置 上 的 数据 元 素 非 常 广 















































便 ， 这 是 顺序 存储 的 优点 。 但 在 对 顺序 结构 进行 插入 和 删除 时 ， 过 移动 数据 元 素来 
实现 ， 这 在 数据 量 不 大 的 情况 下 是 可 行 的 ， 但 当 有 成 千 上 万 的 数据 信息 时 就 不 实用 了 ， 将 
会 影响 程序 的 运行 效率 。 


fee ams 
田径 赛 的 时 间 安 排 问题 


假设 某 校 的 田径 选拔 赛 有 六 个 比赛 项 目 ， 规 定 每 个 选手 最 多 可 参加 三 个 项 目 ， 有 五 人 
报名 参加 比赛 ， 如 表 1.2 所 示 - 设计 比赛 日 程 表 ， 使 其 在 尽 可 能 短 的 时 间 内 完成 比赛 。 


表 1.2 参赛 选手 比赛 项 目 表 























1， 解决 问题 的 方法 
在 解决 该 问题 时 ， 一 般 会 经 历 如 下 几 个 步 又。 
(1) 选择 一 个 合适 的 数据 结构 来 表示 。 
O 假设 用 如 下 六 个 不 同 的 代号 代表 不 同 的 项 目 : 
跳高 跳远 标枪 HER 100m 200m 
A B c D KÆ, F 
则 表 1.2 可 转换 为 表 1.3 所 示 。 INS 
R13 参赛 选手 比赛 项 目 代号 表 
Ur | 一 


WR 
陈 瑞 
显然 ， 同 一 选手 选择 的 儿 个 项 目 间 不 能 同一 时 间 比 赛 。 
© 以 顶点 代表 比赛 项 目 ， 在 不 能 同时 进行 比赛 的 项 目 之 间 连 上 一 条 边 ， 由 此 可 以 得 
到 一 个 图 ， 如 图 .1.2 所 示 ， 该 图 就 是 本 问题 的 数据 结构 模型 。 从 图 中 可 以 看 出 ， 同 一 个 先 
手 选择 的 几 个 项 最 是 不 能 在 同一 时 间 内 比赛 的 ， 因 此 该 选手 所 选择 的 项 目 中 应 该 两 两 有 


pe 
图 1.2 安排 比赛 项 目的 数据 结构 模型 
上 述 由 顶点 和 边 组 成 的 无 向 图 是 数据 结构 中 非 线性 数据 结构 中 的 一 类 。 
(2) 将 该 图 存储 到 计算 机 中 ， 即 确定 存储 结构 。 
(3) 确定 算法 。 竞 赛 项 目的 时 间 安 排 问 题 可 以 抽象 为 对 该 无 向 图 进行 “着 色 ” 问 题 ， 


即使 用 尽 可 能 少 的 颜色 给 图 中 每 个 顶点 着 色 ， 使 得 任意 两 个 有 边 连 接 的 相 邻 顶点 着 上 不 同 
的 颜色 。 每 一 种 颜色 表示 一 个 比赛 时 间 ， 着 上 同一 种 颜色 的 顶点 可 以 安排 在 同一 时 间 内 比 


赛 ,， 如 A 和 C、B 和 DD。 比 赛 项 目的 时 间 安 排 如 表 1.4 所 示 : 
























































数据 结构 (C 语言 版 ) = 














比赛 时 间 比赛 项 目 
A, C 
2 B, D 
3 E 
4 F 








(4) 根据 算法 ， 写 出 解决 问题 的 程序 。 关 于 图 的 算法 实现 在 后 面 的 章节 中 将 讲 到 ， 在 
此 对 本 例 的 程序 不 做 描述 ， 感 兴趣 的 读者 可 以 自行 编写 。 
2. 分 析 


上 述 例子 是 数据 结构 的 典型 例子 ， 例 子 中 的 数据 量 相对 较 少 ， 当 在 对 数据 比较 大 的 问 
题 ， 如 校 运动 会 、 奥 运 会 等 比赛 项 目 进行 安排 时 ， 更 凸显 其 解决 问题 的 高 效 和 精确 。 

通过 对 上 面 两 个 问题 的 分 析 ， 可 以 得 出 ， 为 了 有 效 地 在 计算 机 上 解决 具有 各 种 数据 的 
实际 问题 ， 首 先 必 须 研究 数据 及 数据 之 间 的 关系 ( 即 数据 结构 ) 及 对 这 些 数据 可 以 进行 的 操 
UE p EA re Eae 
处 理 这 样 的 存储 结构 的 算法 ， 以 找 出 最 适 全 解决 问题 的 方案 ， 这 据 结构 和 算法 所 要 
解决 的 问题 。 该 过 程 可 表示 为 : 

实际 问题 一 数 A IGE) CGR BLP DL CH IRE 41) = a MY BEL ME 
法 ) 一 解决 问题 。 
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Har a o d 





L 数据 A 


BUR (Data eas et i aL 处 理 的 符号 的 总 称 。 它 是 
计算 机 程序 加 下 的 “原料 ”包括 整数 、 实 数 、 字 符 、 声 音 、 图 形 、 图 像 等 。 

2. 数据 元 素 

数据 元 素 (Data Element) 是 数据 的 基本 单位 。 有 些 情况 下 ， 数 据 元 素 也 称 为 元 素 、 节 点 、 
顶点 、 记 录 。 有 时 ， 一 个 数据 元 素 可 以 由 若干 个 数据 项 组 成 ， 数 据 项 是 数据 表示 中 不 可 分 
割 的 最 小 单位 。 图 1.3 所 示 为 学 生 信息 数据 。 其中， 一 个 学 生 的 信息 由 一 个 数据 元 素 表 示 ， 
一 个 学 生 信 息 的 数据 元 素 由 学 号 、 姓 名 、 性 别 、 专 业 班 级 、 联 系 方式 五 个 数据 项 组 成 。 

aay 姓名 性 别 专业 班级 联系 方式 
201105215101 VEAN 男 | 计算 机 应 用 111 班 88222222 
201105215223 李志强 男 | 计算 机 应 用 112 班 13958111111 一 个 数 
201105214110 陈 敏 女 | 岂 子 信息 下 程 111 班 13779000000 据 元 素 
201105216125 赵 小 路 k | 电子 商务 111 班 13738555555 

































































一 个 数据 项 


1.3 ”数据 项 和 数据 元 素 


QÇ ss se 
© == m 
3. 数据 类 型 


数据 类 型 (Data Type) 是 具有 相同 性 质 的 数据 的 集合 以 及 在 这 个 集合 上 的 一 组 操作 。 如 
整 型 ， 它 是 [-maxint，maxint] 区 间 上 的 整数 (maxint 是 依赖 于 所 使 用 的 计算 机 及 语言 的 最 大 
整数 )， 在 这 个 整数 集 上 可 以 进行 加 、 减 、 乘 、 整 除 、 取 模 等 操作 。 

数据 类 型 可 以 分 为 原子 数据 类 型 和 结构 数据 类 型 。 原 子 数据 类 型 由 计算 机 语言 自身 提 
供 ， 如 C 语言 的 整 型 、 实 型 、 字 符 型 等 ， 结 构 数据 类 型 是 借用 计算 机 语言 提供 的 能 描述 数 
据 元 素 之 间 逻 辑 关 系 的 一 种 机 制 ， 由 用 户 自己 根据 需要 定义 , 如 C 语言 的 数组 、 结 构 体 等 。 

4. 数据 结构 

数据 结构 (Data Structure) 是 指数 据 之 间 的 相互 关系 ， 即 数据 的 组 织 形式 。 通常 可 以 
个 二 元 组 来 表示 。 例 如 ， 


Data_Stucture=(D, R) 


其 中 ，DD 是 数据 的 有 限 集 ，R 是 D 上 关系 的 有 限 集 。 aK 
Fai SoHE RIM en ea 应 用 计算 机 语言 并 按 一 
ht 其 上 定义 了 一 个 运算 的 集合 。 数 












































据 结构 一 般 包含 以 下 三 方面 的 内 容 。 
CE oe 

(2) 数据 元 素 及 其 关系 在 计算 机 ge POI 省 构 

G) 对 数据 施加 的 操作 ， 即 数 

数据 的 逻辑 结构 是 从 逻辑 关系 人 pt 
无 关 ， 是 独立 于 计算 机 的 。 数据 的 存储 结 pie o ties 算 机 语言 的 实现 ， 是 依赖 于 计 
算 机 的 。 数 据 的 运算 定义 在 逻辑 结构 上 ， 并 在 ane J 上 实现 。 每 种 逻辑 结构 都 有 一 个 
算 的 集合 ， 例 如 ， pam 运算 有 查询 、 插 入 、 除 、 编 辑 、 排 序 等 。 

数据 的 逻辑 结构 通常 有 以 下 四 种 。 下 

(1) 集合 中 的 数据 元 素 之 向 除了 仅仅 同属 于 个 集合 外 ， 不 存在 其 他 关系 ， 如 
图 14 罗 所 示 , 

(2) 线性 结构 : 数据 元 素 之 间 存 在 一 对 一 的 关系 ， 即 元 素 之 间 有 先后 关系 ， 如 图 1.4(b) 
所 示 。 

(3) 树 形 结构 :数据 元 素 之 间 存 在 一 对 多 的 关系 ， 即 元 素 之 间 有 层次 关系 ， 如 图 1.4(c) 
所 示 。 

(4) 图 状 结构 或 网 状 结构 : 数据 元 素 之 间 存在 多 对 多 的 关系 ， 即 任意 两 个 元 素 之 间 都 
可 能 有 关系 ， 如 图 1.4(d) 所 示 。 


DRE (b) 线性 结 (9) 树 形 结构 (d) 图 状 或 网 状 结构 
1.4 ”逻辑 结构 
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数据 的 存储 结构 可 用 以 下 四 种 基本 的 存储 方法 得 到 。 

(1) 顺序 存储 方法 。 该 方法 是 把 逻辑 上 相 邻 的 节点 存储 在 物理 位 置 上 相 邻 的 存储 单元 
里 ， 节 点 间 的 逻辑 关系 由 存储 单元 的 邻接 关系 来 体现 ， 得 到 的 存储 结构 称 为 顺序 存储 结构 
通常 是 借助 于 程序 设计 语言 的 数组 来 实现 。 例 如 ， 线 性 序列 (a，b，c，d，e) 的 顺序 存储 结 
构 如 图 1.5 所 示 。 数 据 的 逻辑 位 序 和 其 在 数组 中 的 下 标 ( 即 物理 位 序 ) 是 一 致 的 。 

数组 下 标 TR 逻辑 位 序 





























o f a] ı 
2 3 
3 4 
图 1.5 顺序 存储 结构 示意 图 XK K 
(2) 链 式 存储 方法 。 a; 
ee ee > 
逻辑 关系 。 由 此 得 到 的 存储 结 td. 借助 于 程序 设计 语言 的 指针 来 实 
现 。 例如， 线性 序列 (a，b，c,， d, se, n 1.6 所 示 。 显 然 ， 光 辑 上 相 邻 的 
元 素 在 物理 位 置 上 不 一 定 相 邻 。 
物理 位 序 逻辑 位 序 
2336 Xl 
3046 - : ar 
ae |e | fs 
zA 2140 4 
SS Bn | x 5 
入 图 1.6 链 式 存储 结构 


一 般 地 ， 链 式 存储 结构 经 常 表示 为 图 1.7 所 示 的 链表 形式 。 


"o ELE OE rH 


图 1.7 链表 示意 图 

(3) 索引 存储 方法 。 该 方法 通常 是 在 存储 节点 信息 的 同时 ， 建 立 附 加 的 索引 表 ， 根 据 
索引 表 能 快速 地 找到 相应 节点 。 索 引 表 中 的 每 一 项 称 为 索引 项 ， 索 引 项 的 一 般 形 式 是 : ( 关 
键 字 ， 地 址 )， 关 键 字 是 能 唯一 标识 一 个 节点 的 数据 项 。 

(4) 散 列 存储 方法 。 该 方法 的 基本 思想 是 根据 节点 的 关键 字 直接 计算 出 该 节点 的 存储 
地 址 。 

上 述 四 种 基本 的 存储 方法 ， 既 可 以 单独 使 用 ， 又 可 以 组 合 起 来 使 用 。 同 一 种 逻辑 结构 
采用 不 同 的 存储 方法 ， 可 以 得 到 不 同 的 存储 结构 。 选 择 何 种 存储 结构 来 表示 相应 的 逻辑 结 
构 ， 视 其 具体 要 求 而 定 ， 主 要 考虑 运算 方便 及 算法 的 时 空 要 求 。 

5， 抽 象 数据 类 型 


抽象 数据 类 型 (Abstract Data Type, ADT) 是 由 一 个 数据 结构 以 及 定义 在 该 数据 结构 上 的 


Qs 
































(2 , 
l rt 绪 论 
O E m 


一 组 操作 组 成 的 。 抽 象 数 据 类 型 的 定义 取决 于 数据 的 逻辑 特性 ， 与 其 在 计算 机 内 部 的 表示 
和 实现 无 关 。 

抽象 数据 类 型 和 数据 类 型 实质 上 是 同一 个 概念 。 例 如 ， 各 种 计算 机 都 拥有 的 整数 类 型 
就 是 一 个 抽象 数据 类 型 ， 尽 管 它们 在 不 同 处 理 器 上 的 实现 方法 可 以 不 同 ， 但 由 于 其 定义 的 
数学 特性 相同 ， 因 此 在 用 户 看 来 都 是 相同 的 。 因 此 ,“ 抽 象 ”的 意义 在 于 数据 类 型 的 数学 抽 


























此 外 ， 抽 象 数据 类 型 的 含义 更 广 ， 它 不 只 局 限于 各 种 处 理 器 中 已 定义 并 实现 的 数据 类 
型 ， 还 包括 用 户 在 设计 软件 系统 时 自己 定义 的 数据 类 型 。 在 近代 程序 设计 方法 学 中 ， 要 求 
在 构成 软件 系统 的 每 个 相对 独立 的 模块 上 , 定义 一 组 数据 和 施加 在 这 些 数据 上 的 一 组 操作 ， 
在 模块 内 部 给 出 了 这 些 数据 的 表示 和 操作 的 实现 方法 ， 而 在 模块 外 部 使 用 的 只 是 抽象 的 数 
据 及 其 操作 ， 这 就 是 面向 对 象 的 程序 设计 方法 。 


伦 
1.3 算法 和 算法 分 析 、、 











因为 数据 的 运算 是 通过 算法 描述 的 ， muya 是 “数据 结构 ”课程 的 重要 内 容 
pa 
1.3.1 算法 7 x 


\ 
ai. Fo UL, ate 求解 步 又 的 一 种 描述 。 更 严格 

地 说 ， 算 法 是 由 若干 条 指令 组 成 的 有 限 序列 ， 它 满足 以 下 准则 : 
(1) 有 穷 性 , 一 个 算法 必须 总 是 在 执行 有 穷 步 之 后 结束 , 且 每 一 步 都 在 有 穷 的 时 间 内 完成 。 


(2) 确定 性 。 Pr ET 义 ， 无 二 义 性 。 

(3) 可 行 性 。 算法 是 可 行 的 ， Was 
amuan i, BA Eat AA 

(4) 输入 算法 有 零 个 或 多 个 输入 ， 作 为 算法 加 工 的 对 象 。 

(5) 输出 。 一 个 算法 有 一 个 或 多 个 输出 ， 这 些 输出 往往 同 输入 有 着 某 些 特定 的 关系 。 

算法 的 含义 与 程序 十 分 相似 ， 但 二 者 是 有 区 别 的 。 算 法 必须 是 有 穷 的 ， 而 一 个 程序 不 
一 定 满足 有 穷 性 。 例 如 ， 系 统 程序 中 的 操作 系统 ， 只 要 整个 系统 不 遭 到 破坏 ， 它 就 永远 不 
会 停止 ， 即 使 没有 作业 要 处 理 ， 它 也 处 于 一 个 等 待 循 环 中 ， 以 等 待 新 的 作业 进入 ， 所 以 操 
作 系统 不 是 一 个 算法 。 因 此 ， 一 个 程序 如 果 对 任何 输入 都 不 会 陷入 无 限 循环 ， 则 它 就 是 一 
个 算法 。 另 外 ， 程 序 中 的 指令 必须 是 机 器 可 执行 的 ， 而 算法 中 的 指令 则 无 此 限制 。 因 此 ， 
一 个 算法 若 能 用 机 器 可 执行 的 语言 来 书写 ， 则 它 就 是 一 个 程序 。 

一 个 算法 可 以 用 自然 语言 、 数 学 语言 或 约定 的 符号 语言 来 描述 。 本 书 将 用 C 语言 来 描 
述 算法 。 
1.3.2 ”算法 分 析 


对 于 一 个 特定 的 实际 问题 ， 可 以 找 出 很 多 解决 问题 的 算法 。 编 程 人 员 要 想 办 法 从 中 选 
择 一 个 效率 高 的 算法 ， 这 就 需要 有 一 个 机 制 来 评价 算法 。 通 常 对 一 个 算法 的 评价 可 以 从 算 
法 执行 的 时 间 与 算法 所 占用 的 内 存 空 间 两 个 方面 来 进行 。 内 存 空 间 一 般 可 以 通过 增加 计算 


多 























BIBI BERD ©) 
9 

机 的 内 存量 米 扩展 ， 但 是 执行 的 时 间 是 不 可 以 扩展 的 ， 因 此 通常 考虑 时 间 要 比 考 虑 内 存 空 
间 的 情况 多 。 本 书 主要 讨论 算法 的 时 间 特 性 ， 也 会 简单 讨论 空间 特性 。 

一 个 算法 所 耗费 的 时 间 ， 是 该 算法 中 每 条 语句 的 执行 时 间 之 和 ， 而 每 条 语句 的 执行 时 
间 是 该 语句 的 执行 次 数 (也 称 为 频 度 ) 与 该 语句 执行 一 次 所 需 时 间 的 乘积 。 但 是 ， 当 算法 转 
换 为 程序 之 后 ， 每 条 语句 执行 一 次 所 需 的 时 间 取决 于 机 器 执行 指令 的 速度 、 编 译 所 产生 的 
代码 质量 等 ， 这 些 是 很 难 确定 的 ， 都 与 具体 的 机 器 有 关 ， 我 们 度量 一 个 算法 的 效率 应 当 殷 
开具 体 的 机 器 ， 仅 考虑 算法 本 身 的 效率 高 低 。 因 此 我 们 假设 执行 每 条 语句 所 需 的 时 间 均 是 
单位 时 间 ， 则 一 个 算法 的 时 间 耗 费 就 是 该 算法 中 所 有 语句 的 频 度 之 和 。 

例 1.1 求 s=1+2+3+…+n， 其 算法 如 下 。 


long sum(int n) 


{ int i} 
long s; K 











(1) i=l; 
(2) while (i<n) 


s 
Ni 


(4) i++; 


l (5) } RY 


VS 
其 中 ， 语 句 (1) 是 赋值 语句 ， ASS 故 语句 频 度 是 1。 语 句 (2) 的 循环 控制 变量 i 
从 1 增加 到 m， 当 Sn 条 件 不 成 立时 六 才 会 终止， ve 但 是 它 的 循环 体 却 只 
能 执行 -1 次 。 语 句 (3) 作 为 语 名 (2) 的 循环 体 执行 x- 世 次 ,而 其 自身 (赋值 语句 ) 执 行 一 次 ， 
因此 语句 (3) 的 频 度 是 ty eI A mL. PRIA IFAT HE) ISIE Z CLD 
算法 的 时 间 耗 费 ) 为 全， NY 
rA Tn)= 1+ n- 1=3n-1 (1.1) 
由 此 可 知 ,> 算法 sum 的 时 间 耗 费 7(n) 是 n 的 函数 。 
例 1.2 求 下 列 算法 段 的 语句 频 度 : 














(1) for(i=1; i<=n; i++) n+l 
(2) for(j =1; j <=n ; j++) n*(n+1) 
(3) x=xt1; n*n 





其 中 ， 右 边 列 出 的 是 各 语句 的 频 度 。 语 句 (1) 是 循环 语句 ， 循 环 控制 变量 i 从 1 增加 到 
nt1， 当 这 对 1 条 件 不 成 立时 ， 循 环 终止 ， 故 它 的 频 度 是 n+1， 但 是 它 的 循环 体 中 每 条 语 
句 均 分 别 只 执行 了 n 次 。 语 句 (2) 作 为 语句 (1) 的 循环 体内 的 语句 执行 n 次 ， 而 其 本 身 要 执行 
ntl 次 ， 所 以 语句 (2) 的 频 度 是 n(m+1)。 同 理 可 得 语句 (3) 的 频 度 是 巡 。 该 算法 段 总 的 语句 频 
度 为 








Tln)=(nt 1)tnX (n+ 1) +n X n=2n+2n+1 (1.2) 

一 般 地 ， 将 算法 求解 问题 的 输入 量 称 为 问题 的 规模 (或 大 小 )， 如 上 面 例子 中 的 n。 由 上 
述 例子 可 知 ， 一 个 算法 的 时 间 频 度 7(n) 是 该 算法 的 时 间 耗 费 ， 它 是 该 算法 所 求解 问题 规模 
n 的 函数 。 
H n 不 断 变 化 时 ， 时 间 频 度 7(n) 也 会 不 断 变化 。 但 有 时 我 们 想 知道 它 变化 时 呈现 什么 


se 

















> . 
| dy 论 
© == i 


规律 。 为 此 ， 我 们 引入 时 间 复 杂 度 的 概念 。 

车 有 某 个 辅助 函数 fn)， 当 n 趋 近 于 无 穷 大 时 ，T(n)/ftn) 的 极限 值 为 不 等 于 零 的 常数 ， 
则 称 fm) 是 T(n) 的 同 数量 级 函数 。 

即 im O se, UE TOMA), MEK OV) 为 和 法 的 渐 近 时 间 复 杂 度 ， 简称 时 
间 复 杂 度 。 例 如 ， 若 T(n)=n(n+1)/2， 则 有 STS, KERERE On), B 
T(n) n BERAE 

在 例 1.1 中 ， 算 法 的 时 间 复 杂 度 7(n) 如 式 (1.1) 所 示 ， 当 n 趋向 于 无 穷 大 时 ， 有 

T(n) 3n-1 

lim 一 一 = lim —— =3 

n->D fin) n->æ® n 
因此 称 该 算法 的 渐进 时 间 复 杂 度 是 T(n)=O(n)。 
理 ， 例 1.2 算法 段 的 时 间 复杂 度 如 式 (1.2) 所 示 ， nee 有 

T(n) _ 2n°+2n+1 peia 
lim —— = lim 

noe f(n) n>% 

该 算法 的 时 间 复 杂 度 为 TUD)=O(0D)。 pis 循环 语句 只 需 考虑 循环 体 中 语句 
的 执行 次 数 ， 而 忽略 该 语句 中 步 长 增 减 、 SUN 制 转移 等 成 分 。 由 此 可 见 ， 当 有 若 
干 个 循环 语句 时 ,算法 的 时 间 复 杂 度 是 由 堪 多 的 循环 语句 中 最 内 层 语句 的 频 度 An) 


决定 的 。 

例 1.3 交换 x 和 y 的 值 。 Ki 2 
temp=x; Ee al 
x=y; 
y=temp; 站 :~ 

以 上 三 eA rr 
数 ， 因 此 ， 时 间 复杂 度 为 常数 阶 ， 记 作 7(n)=O(1)。 事 实 上 ， 只 要 算法 的 执行 时 间 不 
随 问题 规模 n 的 增加 而 增长 ， 即 使 算法 中 有 上 千 条 语句 ， 其 执行 时 间 也 不 过 是 一 个 较 大 的 
常数 ， 此 时 ， 算 法 的 时 间 复杂 度 也 仅 是 O(1)。 

例 1.4 变量 计数 。 

(1) for(i=1; i<=n; i++) 

(2) for(j =1; j <=i; j++) 

(3) x=xt1; 

该 程序 段 频 度 最 大 的 语句 是 (3)， 内 循环 变量 j 的 执行 次 数 虽然 与 问题 规模 n 没有 直接 
关系 ， 但 跟 外 层 循环 变量 i 有关， 而 i 的 执行 次 数 跟 MK, BL Pn 也 有 关 。 因 此 语句 
(3) 的 执行 次 数 可 以 从 内 层 循环 到 外 层 分 析 得 到 : 

交 >1=yi=1+2+3+…+n=nn+D/12 


i=l j=l izl 

















避 























则 该 程序 段 的 时 间 复杂 度 为 T(n)=O(n(n+1)/2)=O(n”)。 
在 很 多 情况 下 ， 算 法 的 时 间 复 杂 度 不 仅仅 是 问题 规模 n 的 函数 ， 还 与 它 所 处 理 的 数据 
集 的 状态 有 关 。 在 这 种 情况 下 ， 通 常会 出 现 最 好 情况 和 最 坏 情况 。 我 们 经 常 对 数据 集 的 分 
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数据 结构 (C 语言 版 ) C ”) 


— —— 7 A D 


布 做 出 某 种 假设 (如 等 概率 )， 并 讨论 算法 的 平均 时 间 复 杂 度 。 

通常 ， 常 见 的 时 间 复 杂 度 ， 按 数量 级 递增 排列 ， 依 次 为 常数 阶 O(D)、 对 数 阶 O(log2n)、 
线性 阶 O(n)、 线 性 对 数 阶 O(nlogzn)、 平 方 阶 O(n’). LAR O(n). se. k RHR O(n’), 
指数 阶 0(2”)。 显 然 ,时间 复杂 度 为 指数 阶 0(2”) 的 算法 效率 极 低 ， 当 n 稍 大 时 就 无 法 应 用 。 

一 个 算法 在 计算 机 存储 器 上 所 占用 的 存储 空间 , 包括 存储 算法 本 身 所 占用 的 存储 空间 、 
算法 的 输入 输出 数据 所 占用 的 存储 空间 和 算法 运行 过 程 中 临时 占用 的 存储 空间 等 。 算 法 的 
空间 复杂 度 (Space Complexity) 主 要 是 对 一 个 算法 运行 过 程 中 临时 占用 的 存储 空间 大 小 的 度 
量 ， 记 作 























S(m=0n)) 
式 中 ，n 为 问题 的 规模 。 
渐进 空间 复杂 度 也 常常 简称 为 空间 复杂 度 。 





me 
小 t SS 
本 章 从 具体 的 应 用 例子 ， iig ee na 结构 的 由 来 ; 
曾 述 了 数据 结构 的 基本 概念 和 基本 术语 ， 包 SH BARTER. 数据 类 型 、 数 据 结 构 、 抽 
象 数据 类 型 等 ， 讨 论 了 数据 结 aera ie: 构 和 存储 结构 ， 介 绍 了 算法 的 概念 及 算法 
的 度量 和 性 能 分 析 。 N 
读者 通过 对 本 章 的 学 习 ， bàn 数据 结构 的 基本 概念 和 基本 术语 ， 能 分 析 算 法 的 


















































时 间 复杂 度 。 > 6 
" pÝ 4 x x 
ary J, y% 
= AS, 
NAG ie 
一 、 填 空 题 个) J 
1 是 数据 的 基本 单位 ， 是 数据 表示 中 最 小 的 单位 。 
2， 数 据 结构 被 形式 地 定义 为 (D，R)， 其 中 D 是 。 ”的 有 限 集合 ,， R 是 D 上 的 
的 有 限 集合 。 
3. 数据 结构 包括 数据 的 、 数 据 的 和 数据 的 这 三 个 方面 的 内 
容 ， 狭 义 的 数据 结构 就 是 指 。 o 
4. 数据 结构 按 逻辑 结构 可 分 为 四 种 ， 它 们 为 ‘ ; 、 和 
5， 线 性 结构 中 元 素 之 间 存在 关系 ， 树 形 结构 中 元 素 之 间 存 在 关系 
图 形 结构 中 元 素 之 间 存 在 关系 。 
6. 数据 的 存储 结构 可 用 四 种 基本 的 存储 方法 表示 ， 它 们 分 别 是 
和 
T. 数据 的 运算 最 常用 的 有 五 种 ， 它 们 分 别 是 和 
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8. 算法 是 多 条 指令 的 











9， 一 个 算法 的 效率 可 分 为 效率 和 效率 。 
二 、 选 择 是 
1.。 非 线性 结构 的 数据 元 素 之 问 存在 ( e) 
A. 一 对 多 关系 B. 多 对 多 关系 
C. 多 对 一 关系 D. 一 对 一 关系 
2， 数据 结构 中 ， 与 所 使 用 的 计算 机 无 关 的 是 数据 的 ( 。 ) 结 构 。 
A. 存储 B. 物理 c. 逻辑 D. 物理 和 存储 
3. 算法 分 析 的 目的 是 ( )。 
和 A、 找 出 数据 结构 的 合理 性 B. 研究 算法 中 的 输入 和 输出 的 关系 
C. 分 析 算 法 的 效率 以 求 改进 D. ae 和 文档 性 
4 算法 分 析 的 两 个 主要 方面 是 ( e) 
A. 空间 复杂 性 和 时 间 复杂 性 >. Bet ave 
C.。 可 读 性 和 文档 性 杂 性 和 程序 复杂 性 
5. 计算 机 算法 指 的 是 (。 )。 
和 A， 计 算 方法 ”排序 方法 
C. 解决 问题 的 有 限 运算 序列 “ys D。， 调 度 方法 
6。 计 算 机 算法 必须 具备 给 入 、 多 ) 五 个 
A. 可 行 性 、 可 移植 性 ye B. S 确定 性 和 有 穷 性 
C. 确 定性、 有 穷 性 和 稳定 D, iE, KENZA 
三 ,简短 题 Z% ew 
> 不 
1. 数据 车 移 和 数据 类 型 丙 个 概 信之 问 有 区 别 吗 ? 


2， 简 述 程序 与 算法 的 异同 点 。 
3. 分析 下 面 算法 段 中 @ 语 名 的 频 度 和 算法 的 时 间 复杂 度 。 
(1) 


x=1,s=0; 
for (i=1;i<=n;++i) 
T apts 

















(2) 
x=1,s=0; 
for (i=1;i<=n;++i) 
for (j=1; j<=n;++j) 
{ +x; 
Sier; =ne @2 
} 








线 性 表 


RA amii 


VA 


学 生成 绩 管理 问题 


学 生成 绩 管 理 系统 是 学 校 教务 部 门 日 ELME RIOR AI, 其 处 理 信 息 量 很 大 。 要 求 设 
计 一 个 简单 模拟 的 学 生成 绩 管理 系统 , 完成 以 下 功能 : 输入 学 生 数 据 ( 见 表 2.1), 输出 学 生 数据 ， 
学 生 信息 查询 ( 按 学 号 查询 、 按 姓名 查询 )， 添 加 学 生 信息 ， 修 改 学 生 数 据 ， 删 除 学 生 信息 。 
表 2.1 FERRES 





学 号 考试 成 绩 
301105015101 31 
201105015102 80 
201105015103 97 
201105015104 -| ` 95 
201105015103 |__| o n | 79 

es amna | 87 


201105015106 


2.1 线性 表 的 定义 和 基本 操作 


在 这 个 学 生成 绩 信 息 表 中 ， 每 个 学 生 的 信息 为 一 条 记录 ， 这 条 记录 也 称 为 数据 元 素 。 
每 个 记录 是 一 个 节点 ， 每 个 节点 由 学 号 、 姓 名 、 专 业 班 级 和 考试 成 绩 四 个 数据 项 组 成 。 对 
于 整个 表 来 说 ， 只 有 一 个 开始 节点 ( 它 的 前 面 无 记录 ) 和 一 个 终端 节点 ( 它 的 后 面 无 记录 )， 其 
他 的 节点 则 各 有 一 个 也 只 有 一 个 直接 前 趋 和 直接 后 继 ( 它 的 前 面 和 后 面 均 有 且 只 有 一 个 记 
录 )。 有 具有 这 种 特点 的 逻辑 结构 称 为 线性 表 ( 线 性 结构 )。 


2.1.1 线性 表 的 定义 
1. 线性 表 的 概念 


线性 表 (Linear Lisb 是 由 nz 三 0) 个 数据 元 素 (节点 )Jai，aw，…，w 组 成 的 有 限 序列 。 
其 中 : 
O) n 为 数据 元 素 的 个 数 ， 也 称 表 的 长 度 。n=0 时 ， 称 为 空 表 ， 记 为 ( )。 



































数据 结构 (C 语言 版 ) 


(2) 常 将 非 空 的 线性 表 (z>0)， 记 作 (w，wm，…，an)。 这 里 的 数据 元 素 al Sin) AE 
一 个 抽象 的 符号 ， 其 具体 含义 在 不 同情 况 下 可 以 不 同 。 

数据 元 素 关 型 多 种 多 样 但 同一 线性 表 中 的 元 素 必定 具有 相同 特性 ， 即 属于 同一 数据 
类 型 。 表 2.2 中 所 有 数据 元 素 都 为 数字 ， 表 2.3 中 所 有 数据 元 素 都 为 字符 ， 表 2.4 PHAR 
据 元 素 都 为 图 片 ， 而 表 2.1 中 所 有 数据 元 素 都 为 记录 (由 若干 数据 项 组 成 的 数据 元 素 )。 








ae: 









































R22 都 为 数字 的 线性 表 
rt2t3t¢tstoetr7tsti 
表 2.3 者 为 字符 的 线性 表 
| si el lel eT | 


#24 ”都 为 图 片 的 线性 表 YA 





2， 线 性 表 的 特点 
数据 元 素 的 非 空 的 线性 表 具 有 下 面 的 特 
(1) 有 且 仅 有 一 个 节点 (cb) 没 有 直接 前 趋 八 称 它 为 开始 节点 。 
(2) 有 且 仅 有 一 个 节点 (an) 没 有 直接 后 继 ， 称 它 为 终端 节点 。 
(3) 除开 始 节点 外 ， 线 表 中 其 他 任 一 节点 a(2<i 加 都 有 且 仅 有 一 个 直接 前 趋 a 。 
(4) 除 终端 节点 外 ， 线性 表 中 其 他 任 一 节点 aC SAE BCH Bee dirio 


2.1.2 识别 线性 表 的 基本 操作 Z 


数据 结 SERRE Re LAs AER 的 ， 而 这 些 操 作 的 具体 实现 是 建立 在 存 
储 结构 层次 - 的 > 在 逻辑 结 千 构 上 定义 的 运算 ,只 给 出 这 些 操作 的 功能 是 “做 什么 ”, 至 于 “如 
何 做 ”等 实现 细节 只 有 在 确定 了 线性 表 的 存储 结构 之 后 才能 完成 。 

对 于 线性 表 的 基本 运算 ， 常 见 的 有 以 下 几 种 : 
(1) 初始 化 mitList(&L)， 即 置 空 表 ， 运 算 结 果 是 将 线性 表 工 设置 成 一 个 空 表 。 
(2) 求 长 度 Length(L)， 当 线性 表 工 为 非 空 时 ， 返 回 表 中 的 节点 个 数 ; 当 线 性 表 为 空 时 ， 
0。 
(3) 判 空 表 Empty(L)， 若 线性 表 工 为 空 表 ， 则 返回 TRUE， 和 否则 返回 FALSE. 
(4) 取 节点 GetElem(L, 让 当 线 性 表 工 已 存在 (1 志 i 二 Length(Z)) 时 ,结果 是 返回 工 中 第 

个 数据 元 素 的 值 ， 否 则 返回 FALSE。 

(5) 定位 Locate(L，item)， Ri neon 中 存在 一 个 值 为 item 的 节点 时 ， 返 回 该 节点 的 
位 置 ; 当 表 工 中 存在 多 个 值 为 item 的 节点 时 ， 返 回首 次 找到 的 节点 位 置 ， 当 表 工 中 不 存在 
值 为 item 的 节点 时 ， ae item 的 节点 不 存在 。 

(6) 插入 Insert(&L，i，e)， 在 线性 表 工 的 第 i 个 位 置 处 插入 一 个 值 为 e 的 新 节点 ， 使 
得 原 有 表 (al，…，a- ，4ai，ait1，"…，an) 变 为 表 (al,，…，aj ，e，ap， Gitts “ts Ando 

(7) 删除 Delete(&L, i), MPRA HER L PIB IMIR, BGA Ra. oo ays ay 
aio “o On) RA (ais t Gags amio > Ando 
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并 非 任何 时 候 都 需要 同时 执行 以 上 运算 。 首 先 ， 不 同 问题 中 的 线性 表 所 需要 执行 的 运 
算 可 能 不 同 ， 其 次 ， 不 可 能 也 没有 必要 给 出 一 组 适合 各 种 需要 的 运算 ， 可 以 用 基本 运算 的 
组 合 来 实现 。 
例 2.1 利用 线性 表 的 基本 运算 实现 清除 表 工 中 的 重复 节点 。 
实现 该 运算 的 基本 思想 : MAR L 的 第 一 个 节点 (二 1) 开 始 ， 逐 个 检查 i 位 置 以 后 的 任 一 
位 置 j， 若 两 节点 相同 ， 则 将 位 置 j} 上 的 节点 从 表 工 中 删除 ， 当 遍历 了 i 后 面 的 所 有 位 置 之 
后 , i 位 置 上 的 节点 就 成 为 当前 表 工 中 没有 重复 值 的 节点 ,然后 将 i 向 后 移动 一 个 位 置 。 重 
复 上 述 过 程 ， 直 至 i 移动 到 当前 表 工 的 最 后 一 个 位 置 为 止 。 该 运算 可 用 如 下 形式 算法 描述 。 



































void Purge(Linear list L) // 删 除 线性 表 工 中 重复 出 现 的 节点 
{ iat. =a žy? 
while (i<Length(L)) // 每 次 循环 都 使 第 i 个 节点 是 无 重复 值 的 节点 
{ x=GetElem (L,i); 7s 
j=i+1; K 
while (j<=Length (L)) 
{ y= GetElem (L,j); j 个 节点 
if (x==y) Delete (&L,j 当前 第 j 个 节点 


else j++; 


itt: 
//eurges! X Z> 


} 


算法 中 的 Delete 操作 使 位 置 +1 上 的 节点 及 其 司 续 节点 均 前 移 了 一 个 位 置 ， 因 此 ， 
应 继续 比较 位 置 ] 上 的 节点 是 否 与 位 置 上 的 节点 相同 ， 同时 ，Delete 操作 使 当前 表 长 度 减 
1， 故 循环 的 终 什 分别 使 用 了 求 长 度 运算 Eenigth 以 适应 表 长 的 变化 。 

PRATER E NIENT AEEA. FEL PARALIA UTEN 
点 ) ， 上 述 算法 宇 确 吗 ? 若 有 误 ， 应 怎样 修改 ? 请 读者 思考 。 














2.2 ”线性 表 的 顺序 存储 、 实 现 和 应 用 


如 何 将 逻辑 结构 为 线性 表 的 学 生成 绩 表 存储 到 计算 机 中 呢 ? 这 是 存储 结构 的 问题 。 数 
据 结构 在 计算 机 中 的 表示 称 为 存储 结构 。 最 常用 的 存储 结构 有 顺序 存储 结构 和 链 式 存储 结 
构 ， 本 节 讨 论 顺 序 存 储 结 构 。 
2.2.1 线性 表 的 顺序 存储 结构 

顺序 存储 结构 是 指 把 线性 表 的 数据 元 素 按 逻 辑 次 序 依次 存放 在 一 组 地 址 连续 的 存储 单 
元 里 。 用 这 种 方法 存储 的 线性 表 简 称 顺序 表 。 

在 顺序 表 的 存储 结构 中 ， 假 设 表 中 每 个 节点 占用 C 个 存储 单元 ， 其 中 的 第 一 个 单元 的 
存储 地 址 则 是 该 节点 的 存储 地 址 ， 并 设 表 中 开始 节点 ai 的 存储 地 址 (简称 为 基地 址 ) 是 
LOC(aD)， 那 么 节点 的 存储 地 址 LOC(a;) 可 以 通过 下 式 计算 得 到 。 
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LOC(a)=LOC(a)+(i-DXC 1<i<n (2.1) 
顺序 表 的 存储 结构 示意 图 如 图 2.1 所 示 。 
逻辑 地 址 。 数据 元 素 存储 地 址 。 数据 元 素 





"EE ft ae 
satire 
也 就 是 说 ， 在 顺序 表 中 ， 每 从 Ds o 的 存储 地 址 是 i 点 在 表 中 的 位 置 i 的 线性 函数 ， 
只 要 知道 基地 址 和 每 个 节点 的 天 小 > A i 出 任 一 节点 的 存储 地 址 。 因 此 顺 
序 表 是 一 种 随机 存 取 结 ae 
a A (一 Cayenne 故 可 以 用 向 量 这 种 数据 类 型 来 


描述 顺序 表 。 xe Kn 
type Sai ElemType; on ElemType 可 为 任何 类 型 , 这 里 假设 为 int 
#define MAXSIZE 1024 // 线 性 表 可 能 的 最 大 长 度 , 这 里 假设 为 1024 


typedef struct 

{ ElemType elem[MAXSIZE];  ”// 线 性 表 是 向 量 存储 ,第 一 节点 是 elem[0] 
int length; // 定 义 length 是 线性 表 的 长 度 

} SqList; 

其 中 ， 数 据 域 elem 是 存放 线性 表 节 点 的 向 量 空间 ， 向 量 的 下 标 从 0 到 MAXSIZE-1, 
线性 表 的 第 i 个 节点 存放 在 向 量 的 第 六 1 个 分 量 中 ， 下 标 是 关 1， 并 假设 表 中 节点 的 个 数 始 
终 不 超过 向 量 空间 的 大 小 MAXSIZE; 数据 域 length 是 线性 表 的 长 度 ，ElemType 是 表 中 节 
点 的 数据 类 型 ， 在 此 可 认为 它 是 某 种 定义 过 的 类 型 ， 其 含义 视 具体 情况 而 定 。 例 如 ， 若 线 
性 表 是 整 型 数据 ， 则 ElemType 就 是 标准 类 型 int; 若 线 性 表 是 英文 字母 表 ， 则 ElemType 就 
是 标准 类 型 char; 若 线 性 表 是 学 生成 绩 表 , 则 ElemType 就 是 已 定义 过 的 表示 学 生成 绩 情况 
的 结构 类 型 。 

当 有 以 下 定义 时 : 

SqList L; 





D 
| i 线 性 表 加 
(9 —— Ba 


其 中 , L 表示 由 一 维 数组 elem 和 长 度 length 组 成 的 顺序 表 。 L 中 第 i 个 节点 表示 为 
L.elem[i-1], L 的 长 度 表 示 为 L.length。 

而 当 工 定义 为 : 

SqList *L; 时 ，Z 为 指向 由 一 维 数组 elem 和 长 度 length 组 成 的 SqList 顺序 表 类 型 的 
指针 。 中 第 i 个 节点 表示 为 L->elem[i-1]( 或 者 (*L).elem[i-1]), 工 的 长 度 表示 为 L->length( 或 
者 (*L).length)。 

总 之 ， 顺 序 表 是 用 向 量 实现 的 线性 表 ， 向 量 的 下 标 可 以 看 作 节 点 的 相对 地 址 。 它 的 特 
点 是 逻辑 上 相 邻 的 节点 其 物理 位 置 也 相 邻 。 


2.2.2 ”顺序 表 的 操作 实现 


定义 了 线性 表 的 存储 结构 之 后 ， 就 可 以 讨论 在 该 存储 结构 上 如 何 具体 实现 定义 在 逻辑 
结构 上 的 运算 了 。 K 


1， 顺 序 表 的 初始 化 K 


算法 2.1 构造 一 个 空 的 顺序 表 。 AD 
构造 一 个 空 的 顺序 表 ， 只 要 把 表 长 置 为 0 即 可 < 
void InitList(SqList *L) D 
{ L->length=0; 人 
SN = 
2 RAG) 1 Jeb 
在 顺序 表 中 查找 一 个 值 为 item 的 节点 ， “fh 返回 该 节点 的 位 置 ， 当 表 志 
中 存在 多 个 值 为 item 的 点 时 ， 返回 首次 找到 的 节 位 置 ; 当 表 工 中 不 存在 值 为 item 的 节 
点 时 ， 返 回 FALSE, < 一 AA 
算法 ANa 工 中 定位 值 为 item HAT. 
int re L, ElemType item) 
0 nt 
for (i=0;i<L.1length;i++) 
if(L.elem[i]= =item) 
return (i+1); 
printf(" 找 不 到 该 值 !") ; 
return FALSE; 
} 


在 本 算法 中 ， 可 能 找到 item， 此 时 平均 比较 次 数 为 O(n/2)， 其 中 ，n 是 顺序 表 的 长 度 ; 
也 有 可 能 找 不 到 item, 这 时 算法 的 比较 次 数 为 O(n), 因此 ,本 算法 的 平均 时 间 复 杂 度 为 O(n)。 

3 插入 数据 

线性 表 的 插入 运算 是 指 在 表 的 第 i(1 志 i<n+1) 个 位 置 上 ， 插 入 一 个 新 节点 e， 使 长 度 为 n 
的 线性 表 (al，…， Oa jr > an) 变 成 长 度 为 nH 的 线性 表 (a1，…， A,» E Gir “tr Ando 

用 顺序 表 作为 线性 表 的 存储 结构 时 ， 由 于 节点 的 物理 顺序 必须 和 节点 的 逻辑 顺序 保持 














A 
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一 致 ， 因 此 我 们 必须 将 表 中 位 置 n nl, ee 工 上 的 节点 后 移 到 nH, n e il 上 ， 空 
出 第 i 个 位 置 ， 然 后 在 该 位 置 上 插入 新 节点 e， 仅 当 揪 入 位 置 i=n+1 时 ， 才 无 需 移动 节点 ， 





























直接 将 e 插入 表 的 末尾 。 
其 插入 过 程 如 图 2.2 所 示 。 
Hi ATT 后 移 后 HANS 
of a | 0 of a | 
1 a 1 1 a 
r2| ar | i-2 i-2 a 
ifiAe>i-1 a; i-l rl e 


i am i 





Length-1— an mt{ (a: | 
OW, 


\ X) 本 an 一 Length 




















MAXSIZE-1| | MAxsize-1f 工 MAXSIZE-1 
图 2.2 、 质 康 表 让 插入 节点 e 的 过 程 
算法 2.3 插入 数据 算法 描述 如 下 > 
int Insert (Sq RK fats al aoa.” 
// 将 新 节点 e nnn LA i ESN 








T aine Jy fe 
if(L<xlang 人 = = MAXSIZE) S > f 
Cpe tf (" 表 满 , 溢出 !") 7 pened FALSE; } 
else {f< || i>L->length) 
{ Printf(" 插 入 位 置 不 合法 !") ; return FALSE; } 





else 
i! for (j=L->length-1; j>=i-1;j--) 
L->elem[j+1]= L->elem[j]; // 节 点 后 移 
L->elem[i-1]=e; // 插 入 e 
L->lengtht++; // 表 长 加 1 
return TRUE; 
} 
注意 : 算法 中 节点 后 移 的 方向 ， 必 须 从 表 中 最 后 一 个 节点 开始 后 移 ， 直 至 将 第 i 个 节 
点 后 移 为 止 。 


分 析 算 法 的 时 间 复 杂 度 。 该 问题 的 规模 是 表 的 长 度 L->length， 设 它 的 值 为 n。 显 然 该 
算法 的 时 间 主 要 花费 在 for 循环 中 的 节点 后 移 语 句 上 ， 该 语句 的 执行 次 数 ( 即 移动 节点 的 次 
数 ， 即 从 arva) n-it1。 由 此 可 看 出 ， 所 需 移动 节点 的 次 数 不 仅 依赖 于 表 的 长 度 n， 还 与 





> 
. — 线 性 表 
(9 === ~N 


插入 位 置 i 有 关 ， 当 i=n+t1 时 ， 由 于 循环 变量 的 终 值 大 于 初 值 ， 节 点 后 移 语句 将 不 执行 ， 
无 需 移动 节点 ; 当 二 1 时 ， 则 节点 后 移 语 句 将 循环 执行 n 次 ， 需 移动 表 中 所 有 节点 。 也 就 
是 说 ， 该 算法 在 最 好 情况 下 的 时 间 复 杂 度 是 O(D); 最 坏 情况 下 的 时 间 复 杂 度 是 O(n)。 由 于 
插入 可 能 在 表 中 任何 位 置 上 进行 ， 因 此 ， 需 分 析 算 法 的 平均 性 能 。 

EREK n 的 线性 表 中 插入 一 个 节点 ， 令 Es (n) 表 示 移 动 节点 次 数 的 期 望 值 ( 即 移动 节 
点 的 平均 次 数 )， 在 表 中 第 i 个 位 置 上 插入 一 个 节点 的 移动 次 数 为 n-it1。 故 
Kye) p(n-itl) (2.2) 
式 中 ，jp, 表 示 在 表 中 第 i 个 位 置 上 插入 一 个 节点 的 概率 。 假 设 在 表 中 任何 合法 位 置 (1<i 和 < 
n+1) 上 插入 节点 的 机 会 是 均等 的 ， 则 


PEP pra =l (n+) , 
因此 ， 在 等 概率 插入 的 情况 下 : ,人 


Es(n)= Sa- i+1)/(n+1)= G K (2.3) 


也 就 是 说 ,在 顺序 表 上 做 插入 运算 时 ， re - 半 节 点 。 当 表 长 1 较 大 时 ， 
算法 的 效率 相当 低 。 昌 然 Es() H n aa 量 级 而 言 ， 它 仍然 是 线性 阶 的 ， 
此 算法 的 平均 时 间 复 杂 度 是 O(W)。 。 - 

4， 删 除数 据 RS 

线性 表 的 删除 运算 是 指 将 表 en 使 长 度 为 的 线性 表 (a1，…， 





























ay? Gi Anis o> qan) 变 成 长 度 》 AE POY Gni an) 
和 插入 运算 类 似 ， ik + Same 动 节点 ， 才 能 反映 出 节点 间 逻 辑 
关系 的 变化 。 若 i=n， 则 EAR ERETT, BA 若 1Si<n-1, Shi 


将 表 中 节点 an eae os dy TRON LI PL sey ed 上 ， 将 原 有 位 置 上 的 节点 
DE ai Jems elu 23 Bias 





Length>n-1 


MAXSIZE-1 


图 2.3 ”顺序 表 中 删除 节点 的 过 程 





数据 结构 (C 语言 版 ) 
a Rr = 


算法 2.4 删除 节点 算法 描述 如 下 。 













该 算法 的 时 间 分 析 与 插入 算法 类 似 ， 节 点 的 移 刀 由 表 长 n 和 位 置 决 定 的 。 若 
i=n， 则 由 于 循环 变量 的 初 值 大 于 终 值 ， 前 移 语 ， 无 需 移动 节点 ; 若 二 1， 则 前 
移 语句 将 循环 执行 n1 次 ， 需 移动 表 中 除开 i 的 所 有 节点 。 这 两 种 情况 下 算法 的 时 
间 复杂 度 分 别 是 O(1) 和 O(n)。 7, “> 

删除 算法 的 平均 性 能 分 析 与 插入 在 长 度 为 a 的 线性 表 中 删除 一 个 节点 ， 令 
Fa) REARDAN AY MRA it 移动 次 数 为 n-i， 故 


,小 名 oo- -Sp tha ea) 
式 中 ， a 节点 的 概率 。 全 的 BER, pepe =peUny 由 此 可 得 ， 
NO Exo) = Din /n= (n-1)/2 (2.5) 
即 在 顺序 表 上 做 测 除 运算 ， 平 均 要 移动 表 中 约 一 半 的 节点 ， 平 均 时 间 复杂 度 也 是 O(n), 
223 ”用 顺序 表 实现 学 生成 绩 管理 问题 
(1) 定义 学 生成 绩 表 中 数据 元 素 类 型 。 





© me 


(2) 编写 程序 ， 实 现 学 生成 绩 管理 系统 中 要 求 的 各 项 功能 。 





数据 结构 ( 语言 版 ) 
一 gS 








数据 结构 (C 语言 版 ) 2 





© ms 线 性 表 
© F l 


printf ("\n 感谢 使 用 本 学 生成 绩 管理 系统 ! \n"); 


return 0; 


} 
puts ("\n 按 任意 键 返回 ! \n"); 
getche( ); 
} 
} 


上 述 程序 首先 将 表 2.1 的 学 生成 绩 信 息 保 存在 文件 StudentInfo.txt 中 ， 其 次 
InitList(&Student) 函 数 初始 化 顺序 表 Student， 再 用 CreateSeqList(&Student) 函 数 将 数据 从 文 
件 读 入 顺序 表 Student， 最 后 才能 进行 查询 、 修 改 、 插 入 、 删 除 等 操作 。 


as 独立 实践 


(1) 按 姓名 查询 学 生成 绩 信息 ， 并 考虑 能 否 查询 多 个 相同 ace 
al a Shee 


2.3 Rea See 


a 

WM, REA EOE 如 下 的 优 缺点 

其 优点 如 下 。 XY 
ne mone. 

O mote : 取 表 中 任 一 节点 。 

其 缺点 如 下 。 wr 

D EARMEN E, ee ee 
EMAII, KARIE] 

(2) 由 于 顺序 表 要 求 占用 连续 的 存储 空间 ， 存 储 分 配 只 能 预先 进行 静态 分 配 )。 因 此 
当 表 长 变化 较 大 时 ， 难 以 确定 合适 的 存储 规模 。 若 按 可 能 达到 的 最 大 长 度 预 先 分 配 表 空间 
则 可 能 造成 一 部 分 空间 长 期 空置 而 得 不 到 充分 利用 ， 若 事先 对 表 长 估计 不 足 ， 则 插入 操作 
可 能 使 表 长 超过 预先 分 配 的 空间 而 造成 溢出 。 

为 了 克服 顺序 表 的 缺点 ， 可 以 采用 链接 方式 存储 线性 表 ， 通 常 我 们 将 链接 方式 存储 的 
线性 表 称 为 链表 (Linked Lis)。 它 不 要 求 逻辑 上 相 令 的 元 素 在 物理 位 置 上 也 相 邻 ， 因 此 它 没 
有 顺序 存储 结构 所 具有 的 缺点 。 按 照 指针 域 的 组 织 及 各 个 节点 之 间 的 联系 形式 ， 链 表 又 可 
以 分 汶 单 链表 、 循 环 链表 、 双 链表 等 多 种 类 型 。 


= = 


AO amet 
病 患 信息 管理 问题 


病 患 信息 系统 需要 把 病 患 的 基本 信息 登录 进 系 统 内 ， 然 后 对 其 进行 增加 、 删 除 、 查 询 、 
修改 等 相关 操作 ， 这 就 需要 把 基本 的 信息 在 计算 机 中 存储 下 来 ， 因 病 患 人 数 的 最 大 值 难以 
确定 ， 故 用 动态 的 处 理 较 节省 空间 ， 则 往往 会 用 链表 的 形式 来 存储 这 些 数据 。 





























2.3.1 单 链 表 


数据 结构 (C 语言 版 ) 


1， 单 链表 的 基本 结构 


链表 用 一 组 任意 的 存储 单元 来 存储 线性 表 中 的 数据 元 素 ， 这 组 存储 单元 可 以 是 连续 的 ， 
也 可 以 是 不 连续 的 ， 甚 至 可 以 零散 分 布 在 内 存 中 的 任何 位 置 上 。 那 么 ， 怎 么 表示 两 个 数据 元 





O 素 罗 辑 上 的 相 邻 关系 ， 即 如 何 表示 数据 元 素 之 间 的 线性 关系 呢 ? 为 此 ， 在 存储 数据 元 素 时 ， 
” ”除了 存储 数据 元 素 本 身 的 信息 外 ， 还 必须 存储 指示 其 后 继 节点 的 地 址 (或 位 置 ) 信 息 ， 这 个 信 


息 称 为 指针 (Pointer) 或 链 (Link)。 这 两 部 分 信息 组 成 了 链表 中 的 节点 结构 ， 如 图 2.4 所 示 。 


[i [os 


图 2.4 单 链表 的 节点 结构 


其 中 ，data 域 是 数据 域 ， 用 
直接 后 继 的 地 址 (或 位 置 )。 链 表 正 是 通过 每 个 节点 的 链 域 将 线性 表 的 去 个 节点 按 其 逻辑 顺序 链接 
在 一 起 的 ,由 于 上 述 链表 的 每 个 节点 只 有 一 个 链 域 ， 故 将 这 种 链表 称 为 单 链表 (Sing e Linked List). 


























假设 有 一 个 线性 表 {ZHAO，QIAN，SUN，LL， 


单 链表 存储 的 内 存 示意 图 如 


为 方便 表示 ， 人 往往 将 图 2.5 简化 为 图 


H 





\ 





来 存放 节点 的 值 ，next 域 是 指针 域 ( 亦 称 链 域 )， 














来 存放 节点 的 








图 2.5 单 链表 的 内 存 示 意图 














2.6 表示 的 单 链表 。 


10U, WU, ZHENG, WANG}, 
图 2.5 所 示 ， 从 图 中 可 以 看 出 ， 罗 辑 相 邻 的 两 个 字符 串 如 
“ZHAO” 与 “QIAN” 的 存储 空间 是 不 连续 的 ， 通 过 在 “ZHAO” 的 指针 域 存放 “QIAN” 
的 存储 位 置 7 来 表示 两 者 迎 辑 上 的 邻接 关系 和 


另外 , “WANG” 的 后 面 没 有 其 他 元 素 , 因此 ， 
它 的 指针 域 值 为 NULL。 









































ZOE RH SN TT RE TY = NT 


图 2.6 单 链表 的 一 般 示意 图 


单 链表 是 最 简单 的 链表 ， 它 由 头 指针 唯一 确定 ， 因 
名 ,例如 ， 若 头 指针 名 是 万 ， 则 把 链表 称 为 表 万 。 表 中 每 个 节点 指向 列 
最 后 一 个 节点 不 指向 任何 其 他 节点 ， 而 指向 NULL， 代 表 链 表 结 束 。 斩 


NWS BS 





表示 该 单 链表 是 


Pao 


表 ， 长 度 为 0。 














此 单 链表 可 以 








3 











Ky 


指针 的 名 称 来 命 








的 下 一 个 节点 ， 


IRE H=NULL, M 


用 C 语言 描述 单 链表 如 下 。 


typedef int ElemType; 
typedef struct LNode // 节 点 类 型 定义 
{ElemType data; 
struct LNode *next; 
} LNode, *LinkList; 


值得 一 提 的 是 ， 我 们 一 定 要 严格 区 分 指针 变量 和 节点 变量 这 两 个 概念 。 


LNode x; // x 是 一 个 结构 体 节点 变量 
LinkList L, p; //Ly p 是 结构 体 指针 变量 


例如 ， 如 上 定义 的 变量 x 是 结构 体 LNode 类 型 的 节点 变量 ， 而 p 是 类 型 为 LinkList 的 

指针 变量 ， 也 可 以 用 结构 体 LNode 类 型 来 定义 指针 工 ，P。 入 

LNode *L, *p; /7 相当 于 LinkList uú ~ 

通常 p 所 指 的 节点 变量 并 非 在 变量 说 明 部 分 明显 地 ; 而 是 在 程序 执行 过 程 中 ， 当 
需要 时 才 产 生 ， 故 称 为 动态 变量 。 实 际 上 ， TAN 函数 生成 的 ， 即 

















Ae Mean eee l dz 
函数 malloc 分 配 一 个 类 型 为 Dot 人 最 的 空间 ,并 将 其 地 址 放 入 指针 变量 中 。 
一 是 所 指向 的 节点 变量 不 再 天 要 了 文通 过 标准 函数 fiee(p)， FE p PRUTE AAEN 
空间 。 Wy xX 

it, HT HO AT ER AR, EE ere Ae Be, HE 
A NTL AAA RNA 27 ROA 
ALBER, BEAM IAAT LARP A. RRID, 即 >next 等 NULL， 

WE 


则 表示 该 链表 为 空 表 >“ 
SN 头 节点 开始 节点 


i E gE a ol 


(a) FER 


i 
(b) 空 表 
图 2.7 带头 节点 的 单 链表 





2， 单 链表 的 操作 实现 


下 面 讨论 用 带头 节点 的 单 链表 做 存储 结构 时 ， 如 何 实现 线性 表 的 几 种 基本 运算 。 
1) 建立 单 链表 
假设 线性 表 中 节点 的 数据 类 型 是 整 型 , 建立 具有 个 元 素 的 单 链表 , 元 素 从 键盘 上 输入 。 


动态 地 建立 单 链表 的 常用 方法 有 以 下 两 种 。 























(1) 尾 插 法 建 表 。 
元 素 从 键盘 上 输入 ， 输 入 -999 表示 结束 。 


BRIBE BERD ©) 
一 Ò 




















O 产生 一 个 新 节点 ， 由 头 指针 工 指向 该 节点 ， 并 使 指针 pp 也 指向 该 节点 ， 如 图 2.8(a) 
所 示 。 实 现 语 句 : L=(LinkList) malloc(sizeof(LNode)); p=L; 

© 从 键盘 上 输入 一 个 整 型 元 素 x， 当 x 为 -999 时 ， 转 到 步骤 @， 当 x 不 等 于 -999 时 ， 
产生 一 个 新 节点 ， 用 p->next 指针 指向 该 新 节点 ， 如 图 2.8(b) 所 示 。 实 现 语句 : p->next 
=(LinkList) malloc(sizeof(LNode)); 

© 将 指针 变量 p 移动 到 p->next 指针 指向 的 节点 , 语句 为 p=p->next, 并 将 x 放 入 该 节 
点 数据 域 的 值 ， 语 句 为 p->data=x， 如 图 2.8(c) 所 示 。 

© 从 键盘 上 输入 一 个 元 素 x， 重 复 步骤 @、@@)。 

© 当 键盘 上 输入 x 的 值 为 -999 时 循环 结束 ， 到 此 已 建成 了 如 图 2.8(d) 所 示 的 单 链表 。 
此 时 ， 最 后 终端 节点 的 指针 域 没有 值 ， 将 其 置 为 NULL， 语 句 : p->next=NULL。 
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7 并 输入 数据 ai 
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x, | (e) k 建 
ri 图 2.8 REHE 

| 图 2.8“ 居 插 法 建立 单 链 表 
于 是 ， 一 个 带头 节点 有 个 元 素 的 单 链表 建立 完毕 。 
算法 2.5 尾 插 法 建立 单 链表 。 


void CreateListR(LinkList L) 
{ne 7, LinkList p; 
L=(LinkList) malloc (sizeof (LNode) ) ; // 分 配 一 个 节点 作为 头 节点 
p=L; 
scanf (“%d”, &x); 
while (x!=-999) 
{ p->next=(LinkList) malloc (sizeof (LNode) ); // 为 后 继 节点 创建 新 空间 
p=p->next; // 指 针 p 移 向 新 节点 
p->data=x; // 把 x BA p 的 数据 域 中 
scanf (“%d”, &x); 
$ 
p->next=NULL; // 单 链表 尾 节点 的 指针 域 置 空 


> 
. — 线 性 表 
(9 = ~N 


尾 插 法 建 表 比较 方便 ， 建 成 的 表 节 点 顺序 与 数据 输入 的 顺序 一 致 ， 因 此 ， 它 是 一 种 最 
为 常用 的 建 表 方法 。 有 时 ， 需 要 建成 的 表 节 点 顺序 与 数据 输入 的 顺序 相反 ， 这 时 用 头 插 法 
建 表 就 能 实现 。 

(2) 头 插 法 建 表 。 

该 方法 从 一 个 空 表 开始 ， 重 复读 入 数据 ， 生 成 新 节点 ， 将 读 入 的 数据 存放 到 新 节点 的 
数据 域 中 ， 然 后 将 新 节点 插入 到 当前 链表 的 表 头 上 ， 直 至 读 入 结束 标志 为 止 。 

过 程 描述 如 图 2.9 所 示 。 


“Ha A 
@、\ 
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YAN XI 
U Gy 链表 创建 完成 Jeb 
图 2 amarak 
算法 2.6 头 插 法 建立 单 链表 。 AS 

void SS B z 

{ ew LinkList s; f 

L= (LinkList)malloc (sizeof (LNode) ) ; 

L->next=NULL; // 先 建立 一 个 带头 节点 的 空 单 链表 

scanf (“%d”, &x); 
while (x!=-999) 

{ s=(LinkList)malloc (sizeof (LNode)); // 生 成 新 节点 


s->data=x; // 将 x 放 入 s 的 数据 域 
s->next=L->next; L->next=s; // 插 入 到 表 头 
scanf (“td", &x) ; // 继 续 输入 元 素 x 


} 
} 


以 上 两 个 算法 的 时 间 复 杂 度 均 是 O(n)。 

2) 定位 ( 按 值 查找 ) 

定位 ( 按 值 查 找 ) 是 在 链表 中 ， 查 找 是 否 有 节点 值 等 于 给 定 值 item 的 节点 ， 若 有 ， 则 返 
可 首次 找到 的 其 值 为 item 的 节点 的 地 址 ， 否 则 返回 NULL。 查 找 过 程 从 开始 节点 出 发 ， 顺 
着 链表 逐个 将 节点 的 值 和 给 定 值 item 做 比较 ， 直 到 找到 item， 即 查找 成 功 ; 或 者 已 经 到 链 


表 结 束 ， 查 找 失败 ， 如 图 2.10 所 示 。 




















while(p&&p->data!—item) 
P=p->next; 








— p 
图 2.10 在 单 链表 中 查找 值 为 item 的 节点 
算法 2.7 REER. 


LinkList Locate (LinkList L,ElemType item) 
// 在 链表 中 查找 一 个 值 为 item 的 节点 
{ LinkList p; 


p=L->next; 
while (p&&p->data!=item) 
p=p->next; 

if(!p) return NULL; co 

else return (p); 

} 
在 有 些 应 用 中 , 按 值 查找 时 需 返 回 找到 的 item — 
在 算法 2.7 中 ，while 语句 的 终止 条 件 是 搜 ek ii p->data 一 item， 它 和 被 寻 





找 元 素 的 所 在 位 置 有 关 。 总 之 ， 在 第 ;个 位 E 最 多 需要 比较 次 数 为 i 次 。 因 而， 在 等 
概率 假设 下 ， 平 均 时 间 复杂 度 为 、< 


SS =(n+1)/2=O(n) 
1 Ur 
Sr irons, 

3) 插入 数据 

假设 指针 p 指向 单 Reg 一 节点 ， 指 针 efi 其 值 为 x 的 新 节点 。 若 将 
新 节点 *s 插入 节点 *p 之 后 ， 则 简称 为 “后 MBG tS 插入 在 *p 之 前 ， 则 简称 为 “前 插 ”。 
两 种 插入 操作 六 IE RAR Ki 然 人 再 插入 。 这 里 以 后 插 为 例 ， 前 
插 请 读者 自行 

后 插 操 作 较 简单 ， 其 插入 过 程 如 图 2.11 所 示 。 其 算法 如 下 。 


void InsertAfter (LinkList p, ElemType x) // 将 值 为 x 的 新 节点 插入 *p 之 后 
{ LinkList s; 


s=(LinkList)malloc (sizeof (LNode) ) ; // 生 成 新 节点 *s, 图 中 步骤 @ 
s->data=x; // 图 中 步骤 @ 
s->next=p->next; // 图 中 步骤 四 
p->next=s; // 将 *s 插入 *p 之 后 , 图 中 步骤 @ 
} 
Pp 
@\ 


1@ 
.oo 


2.11 在 节点 p 之 后 插入 节点 s 


> 
. ce oa 线 性 表 
© —— B 








单 链表 的 插入 运算 Insert(L, i 习 是 生成 一 个 值 为 x 的 新 节点 ， 并 将 其 插入 到 链表 工 中 
第 i 个 节点 之 前 ， 也 就 是 插入 到 第 六 1 个 节点 之 后 。 步 又: 首先 从 头 节点 开始 找到 第 六 1 个 
车 点 , 用 指针 指向 , 然后 生成 一 个 新 节点 s, 将 值 x 放 入 s 的 数据 域 , 再 将 s 插入 到 pp 后 ， 


6 Q 
e 
完成 该 运算 。 过 程 如 图 2.12 所 示 。 A 
[wT {eT fe Ae 4 Ee 
i < 
while(p && j<i-1) © @s-(LinkList)malloc(sizeofLNode)): 


1B = k 
P {p=p->next; ++j} p [e] s @s->data=x; 
j=0 © @s->next=p->next; 
@p->next=s; 


A212 ”插入 过 程 示意 图 





























算法 2.8 插入 运算 。 


int Insert (LinkList L, int i, ElemType “see 


/ FERRE 的 第 i 个 节点 前 插入 元 素 item 
{ LinkList p,s; p=L; 


int j=0; 
while(p && j<i-1) ”// 找 到 第 nae 

{ p=p->next; ++j; } > x, 
if( !p || j>i-1) return F; oa 
s=(LinkList)malloc teeta Die 
s->data= item; D 
s->next=p->next; =S}; xh 
return TRUE; We At 


a om. We 所 n+1， 算 法 Insert 的 时 间 主 要 耗费 在 查 
saree 月 杂 度 为 O(n)。 








A eee 要 删除 单 链表 中 节点 六 的 后 继 很 简单 ， 首 先 用 一 个 指针 E Td a 
节点 ， 然 后 修改 *p 的 指针 域 ， 最 后 释放 节点 gr。 其 过 程 如 图 2.13 所 示 ， 图 中 的 “存储 池 ” 
是 备用 的 节点 空间 ， 释 放 节 点 就 是 将 节点 空间 归还 到 存储 池 中 。 

该 过 程 可 用 语句 描述 如 下 。 


LinkList r; 





























r=p->next; // 示 意图 中 步骤 @ 
p->next=r->next; // 图 中 步骤 @@, 将 节点 *r 从 链表 上 删除 
free(r); // 图 中 步骤 @@, 释 放 节点 
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图 2.13 删除 *p 之 后 的 节点 


数据 结构 (C 语言 版 ) ( i) 
= A ` 
} Ò 


向 车 被 删节 点 就 是 p 所 指 的 节点 本 身 ， 则 和 前 插 问 题 类 似 , 必须 修改 *p 的 前 趋 节点 *g 的 
指针 域 。 


因此 一 般 情况 下 也 要 从 头 指针 开始 顺 着 链表 找到 *p 的 前 趋 节点 *9， 然 后 删除 
其 删除 过 程 如 图 2.14 所 示 。 


四 
aE p) 
or 4 ->next; 









站) 




















图 2.14 删除 节点 *p 
算法 描述 如 下 。 
int DeleteP (LinkList L,LinkList p) Rs 
// 在 单 链表 工 中 删除 p 节点 本 身 K 
{LinkList q; 


q=L; //q sa cen 

while(q->next && q->next!=p) aes 前 趋 *q 
q=q->next; 

if (q->next==NULL) return we 

else 

{ q->next=p->next 3 // 从 链表 
free (p); 1% deri 
return = ~ 


另外 SACU ALTE T EN 节点 中 ,然后 
删除 *p 的 法 要 求 *p 有 后 继 ， 不 是 终端 节点 。 请 读者 自 己 完成 删除 节点 *p 的 算法 。 

单 链表 的 删除 运算 Delete(L，) 是 指 删 除 单 链表 中 第 i 个 节点 ， 方 法 类 似 于 插入 运算 : 
从 头 节点 开始 找到 第 六 1 个 节点 ， 再 删除 其 后 继 节点 。 删 除 过 程 如 图 2.15 所 示 


wa —$—S 8 P 存储 池 
J0 © 


A215 “删除 过 程 示意 图 
算法 2.9 删除 运算 。 


int Delete (LinkList L, 
// 删 除 单 链表 工 中 第 AE 


{ LinkList p,q; 


int i) 


int j; 


Qs 


£ Bem 线 性 表 


设 单 链表 的 长 度 为 n”， 则 删除 第 i 个 节点 仅 当 1<i<n 时 是 合法 的 。 显然 算法 Delete 的 





时 间 复 杂 度 也 是 O(n)。 
从 上 面 的 讨论 可 以 看 出 ， 链 表 上 实现 的 插入 和 删除 运算 ， 无 需 移 动 节 点 ， 仅 需 修改 指 
针 。 fe 
S 
23.2 用 单 链表 实现 病 患 信息 管理 问题 < 
下 面 用 带头 节点 的 单 链表 做 存储 结构 ， 来 六 息 管理 系统 。 
(1) 定义 病 患 信息 数据 元 素 类 型 。 ” AN 





(2) 编写 程序 ， 实 现 病 患 信息 管理 系统 中 要 求 的 各 项 功能 。 


9 


数据 结构 ( 语言 版 ) 
一 SS ae 








数据 结构 ( 语言 版 ) 
一 et es 











f 


A 
ge 独立 实践 


将 新 病人 插入 到 链表 的 指定 位 置 。 
2.3.3 ”循环 链表 


在 单 链表 中 ， 将 终端 节点 的 指针 域 NULL 改 为 指向 表 头 节点 或 开始 节点 ， 就 得 到 了 单 
链表 形式 的 循环 链表 ， 简 称 为 单 循 环 链表 。 在 单 循环 链表 中 ， 表 中 所 有 节点 被 链接 在 一 个 
环 上 。 为 了 使 空 表 和 非 空 表 的 处 理 一 致 ， 循 环 链表 中 也 可 设置 一 个 头 节点 。 这 样 ， 空 循环 
链表 仅 由 一 个 自 成 循环 的 头 节点 表示 。 带 头 节点 的 单 循环 链表 如 图 2.16 所 示 。 


We ET) aR 


(a) HK (b) 238 
A216 SERRA 





Qs 


TB: 
© * 线 性 表 
© = ~N 
在 单 循环 链表 上 的 操作 基本 上 与 非 循环 链表 相同 ， 只 是 将 原来 判断 指针 是 否 为 NULL 
变 为 是 否 为 头 指针 而 已 ， 没 有 其 他 变化 。 
例 2.2 求 单 循环 链表 的 长 度 。 
过 程 如 图 2.17 所 示 ， 算 法 如 下 。 


int Length(LinkList L) 
{ int n; 

















LinkList p; 
p=L; n=0; 
while (p->next!=L) 
{ p=p->next; 
++n; 
} 
return (n); 


} 





ee 
在 上 述 算法 中 ， 通 过 指 梧 有 从 关节 ， ae :总 和 用 于 来 计算 节点 个 数 ， 当 指针 


指向 终端 节点 时 表示 统计 结束 ， 条 件 是 ES 

于 NULL)。 该 算法 的 平均 时 间 复杂 度 为 O()。 NY 
在 用 头 指针 表示 的 单 循环 链表 中 ， ROE 点 ay 的 时 间 是 O(1), 然而 要 找到 终端 节点 
an WEAK 始 遍 有 历 整个 链表 ， 其 时 间 是 O(n)。 在 很 多 实际 问题 中 ， 表 的 操作 常常 
是 在 表 的 首尾 位 置 上 进行 的 ， 此 时 头 指针 表示 的 单 循 环 链表 就 显得 不 够 方便 。 如 果 改 用 尾 
指针 rear 来 表示 单 循 环 链表 ( 见 图 2.18)， 则 查找 开始 节点 a 和 终端 节点 a, 都 很 方便 ， 它 们 
的 存储 位 置 分 别 是 rear->next->next 和 rear， 显 然 ， 查 找 时 间 都 是 O(1)。 因 此 ， 实 际 中 多 采 
尾 指针 表示 单 循环 链表 。 


Sees Ep 


图 2.18 仅 设 尾 指针 rear 的 单 循环 链表 
例 2.3 在 链表 上 实现 将 两 个 线性 表 (a1，42，…，aw) 和 (bl1，b,，…，bm) 链 接 成 一 个 线性 
表 (q1，q2，…，an，b1，b2，…，bnm) 的 运算 。 
若 在 带头 指针 表示 的 单 循 环 链表 上 做 这 种 链接 操作 ， 则 需要 遍历 第 一 个 链表 ， 找 到 节 
点 on， 然后 将 节点 bi 链接 到 a, 的 后 面 ， 其 执行 时 间 是 O(n)。 若 在 尾 指针 表示 的 单 循环 链 
表 上 实现 , 则 只 需 修改 指针 , 无 需 遍 历 , 其 执行 时 间 是 O(1)。 指针 修改 过 程 如 图 2.19 所 示 。 


相应 的 算法 如 下 。 


LZ( 若 是 单 链表 ， 则 条 件 是 p->next 等 























Ok 







































































数据 结构 (C 语言 版 ) 


LinkList Connect (LinkList ra, LinkList rb) 
{ LinkList *p; 


p=ra->next; // 保 存 表 ra 的 头 节点 地 址 
ra->next=rb->next->next; // 链 表 rb 的 开始 节点 链接 到 链表 ra 的 终端 节点 之 后 
free (rb->next) ; // 释 放 链表 rb 的 头 节 点 
rb->next=p; // 返 回 新 循环 链表 的 尾 指针 














图 2.19 两 个 单 和 环 链 表 的 链接 操作 示意 图 
2.3.4 MER AN 
前 面 讨论 的 线性 链表 的 节点 中 只 有 一 个 指向 其 后 继 节 点 的 指针 域 next， 因 此 找到 其 后 
继 非常 方便 ,车 已 知 某 节 点 的 指针 为 p, 其 后 继 节 点 的 指针 则 为 p->next, 时 间 复 杂 度 是 O(D)， 
而 要 找到 其 前 趋 节点 ,就 只 能 从 该 链表 的 头 指 针 开始 ， 从 前 向 后 遍历 ,时 间 复杂 度 是 O(n)。 
如 果 希 望 找 前 趋 的 时 间 复杂 度 也 是 OOD)， 则 可 以 用 空间 换取 时 间 ， 即 给 每 个 节点 再 增加 一 
个 指向 前 趋 的 指针 域 ， 节 点 结构 如 图 2.20 所 示 。 WX 








«Ro 图 2.20 站 双 莲 表 结 点 结构 
其 中 ,每 外 节点 除了 数据 域 data 外 ， 包 含 了 两 个 指针 域 : 一 个 是 prior 指针 ， 指 向 它 的 
前 趋 节点 ， 一 个 是 next 指针 ， 指 向 该 节点 的 后 继 节点 。 该 节点 的 类 型 定义 如 下 。 


typedef struct DLNode 
{ ElemType data; 

struct DLNode *prior, *next; 
}DLNode, *DLinkList; 


这 种 两 个 指针 域 节点 组 成 的 链表 称 为 双向 链表 ， 简 称 双 链表 。 与 单 链表 类 似 ， 双 链 
表 可 以 是 非 循环 的 ， 也 可 以 是 循环 的 。 本 书 默 认 的 是 带头 节点 的 双向 循环 链表 ， 如 图 2.21 
所 示 。 


”| 
fie LT) 一 TO 


(a) 非 空 表 (b) 空 表 
2.21 ”带头 节点 的 双 链 表 


























Lo 


© == ~~ ie 

车 定义 pp 是 DLinkList 类 型 的 指针 变量 ， 设 p 指向 双 链表 中 的 某 一 节点 ， 如 图 2.22 所 

示 ， 则 p->next 表示 p 所 指向 节点 的 直接 后 继 节点 地 址 , 而 p->prior 表示 p 直接 前 趋 节点 的 
地 址 。 同 时 ， 有 如 下 等 价 式 。 


p->prior->next © p © p->next->prior 


ae ae 


图 2.22 p 指向 双 链 表 的 某 节点 
在 双 链 表 上 的 操作 实现 ， 求 表 长 、 元 素 定位 、 查 找 元 素 等 操作 仅 涉及 一 个 方向 的 指针 ， 
类 似 于 单 链 表 ， 这 里 请 读者 自行 完成 。 在 双 链 表 中 完成 插入 和 删除 操作 则 需要 修改 两 个 方 











Re 





向 的 指针 。 下 面 分 别 对 其 进行 讨论 。 5i 

1， 双 链表 中 插入 一 个 节点 SS 

在 双 链 表 中 插入 节点 有 多 种 方式 ， wa 在 插入 节点 时 无 须知 道 插 入 
位 置 的 前 趋 节点 , 可 以 直接 找到 相应 的 节点 ， TA. 设 p 指向 链表 中 第 i 个 节点 ， 
s 指向 待 插入 的 节点 , 将 s 节点 插入 到 pp, 节 ia 插入 过 程 如 图 2.23 所 示 , 语句 描述 
如 下 。 N 

@ s->prior=p->prior; > xX 

© s->next=p; sys W 1K) 

@ p->prior->next= A XXX L 

® eae on i X 4 





2.23 在 p 结 点 前 插入 s 结 点 
需要 强调 的 是 ， 上 述 操作 中 的 指针 修改 顺序 并 不 是 唯一 的 ， 但 也 不 是 任意 的 ， 操 作 过 
程 中 必须 确保 链表 节点 不 丢失 。 
在 双 链 表 工 中 的 第 i 个 节点 前 插入 一 个 元 素 c, 插入 算法 如 下 。 





int ListInsert Dul(DLinkList L, int i, ElemType e) 
{ DLinkList p; 

int j; 

p=L; j=0; 

while(p && j<i) // 寻 找 第 i 个 节点 ,并 令 p 指 向 它 





该 算法 时 间 主 要 用 在 查找 第 i 个 节点 上 ， 时 间 复 杂 度 为 O(n)。 
2， 双 链表 中 删除 一 个 节点 


在 双 链 表 中 删除 节点 也 有 多 种 方法 ， 与 单 链表 不 同 的 是 ，t tt 
趋 节 点 ， 直 接 找 到 被 删除 的 节点 ， 然 后 执行 相关 的 指针 修 可 。 以 删除 第 i 个 节点 
为 例 ， 设 p 指向 双向 链表 中 第 i 个 节点 ， 删 除 p 节点 如 图 2.24 所 示 ， 语 句 描述 
如 下 : AN 

© p->prior->next=p->next; AN 

©® p->next->prior = p->prior ; > X P 

@ free(p); KAI 

删除 双 链 表 工 中 的 第 i 个 节点 Fe 






图 2.24 ”删除 结 点 p 
同 插入 算法 相似 , 删除 算法 的 主要 时 间 消 耗 在 查找 第 i 个 节点 上 ,时间 复 杂 度 为 O(n)。 


Qs 


© -一 


2.4 ”顺序 表 和 链表 的 比较 





前 面 两 节 介绍 了 线性 表 的 两 种 存储 结构 :顺序 表 和 和 链表， 它们 各 有 优 缺 点 。 在 实际 应 
中 选用 哪 一 种 存储 结构 主要 取决 于 具体 问题 的 要 求 和 性 质 。 通 常 有 以 下 两 方面 的 考虑 。 
1. 从 空间 上 


顺序 表 的 存储 空间 是 静态 分 配 的 ， 在 程序 执行 之 前 必须 明确 规定 它 的 存储 规模 。 若 线 
性 表 的 长 度 n 变化 较 大 ， 则 存储 规模 难以 预先 确定 。 估 计 过 大 将 造成 空间 浪费 ， 估 计 过 小 
又 将 使 空间 溢出 几率 增 大 。 而 动态 链表 的 存储 空间 是 动态 分 配 的 ， 只 要 内 存 空间 尚 有 空闲 ， 
就 不 会 产生 溢出 。 因 此 ， 当 线性 表 的 长 度 变化 较 大 ， 难 以 估计 其 存储 规模 时 ， 采 用 动态 链 
表 作 为 存储 结构 为 宜 。 K 
7 
2， 从 时 间 上 7 


SN 
顺序 表 是 mm, ee AML mt ta 
BREM, MRRP SLAP BERRA HEN. ak, He HR 
作 主 要 是 进行 查找 ， 很 少 做 插入 和 曾 除 操作 时 ， 习 用 顾 序 表 做 存储 结构 为 宣 。 

在 链表 中 的 任何 位 置 上 进行 插入 和 出 了 部 需要 修改 指针 。 而 在 顺序 表 中 进行 插入 和 
bik. Yoon ese EA RIL HAE ARAL, Bab BAIN 
TTPLARAR TT AL. Bt, FARES RUMBRRUERIE AE, ORRERA. 
车 表 的 插入 和 删除 主要 发 生 在 表 的 首尾 两 端 ， 则 采用 尾 指 钙 琢 示 的 单 循环 链表 为 宜 。 

we 
y 小 人 
<a> i EN, 

线性 表 是 种 最 基本 、 最 常用 的 数据 结构 。 本 章 介绍 了 线性 表 的 定义 、 运 算 和 各 种 存 
储 结构 的 描述 方法 ， 重 点 讨论 了 线性 表 的 两 种 存储 结构 一 一 顺序 表 和 链表 ， 以 及 在 这 两 种 
存储 结构 上 实现 的 基本 运算 。 

顺序 表 是 用 数组 实现 的 ， 链 表 是 用 指针 实现 的 。 在 实际 应 用 中 ， 对 线性 表 采 用 哪 种 存 
储 结构 ， 要 视 实际 问题 的 要 求 而 定 ， 主 要 考虑 求解 算法 的 时 间 复杂 度 和 空间 复杂 度 ， 因 此 ， 
建议 读者 部 练 掌握 在 顺序 表 和 链表 上 实现 的 各 种 基本 运算 及 其 时 间 、 空 间 特性 。 









































































































































习 a 
一 、 填 空 题 
1. 向 一 个 长 度 为 n 的 向 量 的 第 i 个 元 素 (1 志 i 和 n+1) 之 前 插入 一 个 元 素 时 ， 需 向 后 移动 
个 元 素 。 
2. 向 一 个 长 度 为 n 的 向 量 中 删除 第 i 个 元 素 (1<i<n) 时 , 需 向 前 移动 个 元 素 。 
3. 在 顺序 表 中 访问 任意 一 个 节点 的 时 间 复 杂 度 均 为 ， 因 此 ， 顺 序 表 也 称 为 
的 数据 结构 。 
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a a 
4. 顺序 表 中 逻辑 上 相 邻 的 元 素 的 物理 位 置 相 邻 。 单 链表 中 逻辑 上 相 邻 的 元 素 
的 物理 位 置 相 邻 。 
5. 在 nn 个 节点 的 单 链表 中 要 删除 已 知 节点 要 ， 需 找到 它 的 ， 其 时 间 复 杂 度 为 
二 、 判 断 题 


1. 链表 的 物理 存储 结构 具有 同 链表 一 样 的 顺序 。 《4 

2. 链表 的 删除 算法 很 简单 ， 因 为 当 删 除 链 中 的 某 个 节点 后 ， 计 算 机 会 自动 将 后 续 各 个 
单元 向 前 移动 。 ( 

3. 顺序 表 结 构 适 宜 进行 顺序 存 取 ， 而 链表 适宜 进行 随机 存 取 。 

4. 线性 表 在 物理 存储 空间 中 也 一 定 是 连续 的 。 

S. SCRONTHIE, A LH RUNES A, 

6. 线性 表 的 逻辑 顺序 与 存储 顺序 总 是 一 致 的 。 SR 


三 、 选 择 题 
1. 一 个 向 量 第 一 个 元 素 的 存储 地 址 是 oa 2， 则 第 5 个 元 素 的 地 


一 一 一 一 
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址 是 (  )。 

A. 110 B. 108 eRe 100 D. 120 

2， 在 个 节点 的 顺序 表 中 ， A 疝 复 杂 放 是 Oo 的 操作 是 je 
A. 访问 第 i 个 节点 (1& 求 第 1 个 节点 的 驳 (2<i<n) 
B. OL PHBA YK 
C. NBR i NAUS) 
D. Hn PHS SHER Ne 

3， 链 接 存储 的 存储 结 AIPE 
A. ， 一 部 分 存放 节点 值 。 om 一 部 分 存放 表示 节点 问 关系 的 指针 
B RECHA, MONM 


C RAH 部 分 ， 存 储 表示 节点 间 关 系 的 指针 
D. 分 两 部 分 ， 一 部 分 存放 节点 值 ， 另 一 部 分 存放 节点 所 占 单元 数 
4. 线性 表 若 采 用 链 式 存储 结构 时 ， 要 求 内 存 中 可 用 存储 单元 的 地 址 ( 。“)。 




















A. 必须 是 连续 的 B， 部 分 地 址 必须 是 连续 的 
C. 一 定 是 不 连续 的 D. 连续 或 不 连续 都 可 以 
5. 线性 表 工 在 ( ， ) 情 况 下 适用 于 使 用 链 式 结构 实现 。 
A. 需 经 常 修改 工 中 的 节点 值 B. 需 不 断 对 工 进 行 删 除 插入 
C. 工 中 含有 大 量 的 节点 D. 工 中 节点 结构 复杂 
6. 线性 表 是 ( ) 
A. 一 个 有 限 序列 ， 可 以 为 空 B. 一 个 有 限 序列 ， 不 能 为 空 
C， 一 个 无 限 序列 ， 可 以 为 空 D. 一 个 无 序 序列 ， 不 能 为 空 
7. 用 链表 表示 线性 表 的 优点 是 ( )- 
A. 便于 随机 存 取 


B. 花费 的 存储 空间 较 顺序 存储 少 


C. 便于 插入 和 删除 
D. 数据 元 素 的 物理 顺序 与 逻辑 顺序 相同 
8. 对 顺序 存储 的 线性 表 , 设 其 长 度 为 n, 在 任何 位 置 上 插入 或 删除 操作 都 是 等 概率 的 。 
插入 一 个 元 素 时 平均 要 移动 表 中 的 ( ATR. 
A. ni2 B. (n+1)/2 C. (n-1)/2 D. n 


四 、 简 答题 


1. 试 比较 顺序 存储 结构 和 链 式 存储 结构 的 优 缺 点 。 在 什么 情况 下 用 顺序 表 比 链表 好 ? 
2. 描述 以 下 三 个 概念 的 区 别 : 头 指针 、 头 节点 、 开 始 节点 。 在 单 链表 中 设置 头 节点 的 
作用 是 什么 ? 


五 、 编 程 题 


7K 
1. 设 顺序 表 工 中 的 数据 元 素 递增 有 序 。 试 编写 一 算法 4 N 
以 保持 该 表 的 有 序 性 。 
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原 表 的 存储 空间 内 将 线性 表 (al，a2，a3，…, ay (an anmo s a» ad)o 
3， 设 指针 * 指向 单 循环 链表 的 一 个 节点 : 请 设计 算法 ， 删 除 该 节点 的 前 趋 节点 。 
了 
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re 问题 描述 
迷宫 求解 问题 Xs 
So 


tf 宫 中 设置 很 多 墙壁 ( 设 0 为 
通道 ，1 为 墙壁 )， 对 前 进 方向 形成 了 多 处 障碍 。 并 在 迷宫 的 唯一 出 口 放置 了 一 块 奶酪， 吸 


SS 
引 老鼠 在 迷宫 中 寻找 通路 以 到 达 出 口 。 请 编程 求 出 迷宫 的 通路 。 














3.1.1 栈 的 定义 


堆栈 (Stack) 也 简称 为 栈 ， 是 限定 仅 在 表 的 一 端 进行 插入 和 删除 操作 的 线性 表 。 通 常 将 
进行 插入 和 删除 的 一 端 ( 表 尾 ) 叫 做 栈 顶 (top)， 不 允许 插入 和 删除 的 另 一 端 ( 表 头 ) 叫 做 栈 底 
(bottom)， 不 含 任何 元 素 的 栈 叫 做 空 栈 。 

插入 数据 元 素 的 操作 叫做 进 栈 ， 也 称 压 栈 、 入 栈 。 删 除数 据 元 素 的 操作 叫做 出 栈 ， 也 
称 为 退 栈 。 由 于 堆栈 元 素 的 插入 和 删除 只 是 在 栈 顶 进行 的 ， 总 是 后 进去 的 元 素 先 出 来 ， 所 
以 堆栈 又 称 为 后 进 先 出 线性 表 或 LIFO(Last In First Out) 表 。 堆栈 在 日 常生 活 中 也 经 常见 到 ， 
如 将 子弹 装 入 弹 夹 式 的 手枪 ， 弹 夹 的 一 端 是 封闭 的 ， 子 弹 的 放 入 和 取出 都 是 从 弹 夹 的 一 端 
进行 的 ， 它 就 是 一 个 堆栈 。 


Q a 楼 与 队列 | 
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理解 堆栈 的 定义 时 需要 注意 : 它 是 一 个 线性 表 ， 也 就 是 说 ， 栈 元 素 具有 线性 关系 ， 即 
前 趋 后 继 关 系 。 只 不 过 它 是 一 种 特殊 的 线性 表 ; 定义 中 所 说 的 在 线性 表 的 表 尾 进行 插入 和 
删除 操作 ， 这 里 的 表 尾 是 指 栈 项， 而 不 是 栈 底 。 我 们 可 以 用 图 3.2 来 形象 地 说 明 。 


as, tt 
































TR 
RM RA 
Gia HE 栈 底 
图 3.2 进出 栈 示意 图 
3.1.2 栈 的 基本 操作 Ks 
对 于 栈 的 基本 运算 ， 常 见 的 有 以 下 几 种 。 SS 

InitStack (4S) // 初 始 化 栈 :构造 一 个 3 
Clearstack (&S) // 置 空 栈 : us ti 空 栈 
StackLength (S) // 求 栈 的 长 度 :返回 栈 s 中 的 元 素 个 数 
StackEmpty(S) 1/908 否 为 空 : 若 栈 s 为 空 , 则 返回 真 ; 否则 返回 假 
Push (&S,e) / :将 插入 元 素 e 为 新 的 栈 项 元 素 
Pop (&S, &e) : 若 栈 不 空 , 则 删除 s 的 栈 顶 元 素 , 用 e 返回 其 值 


ep X 项 元 素 :返回 项 元 素 , 并 将 其 赋值 给 e 
DispStack(S) SMI 7/ 显示 元 素 : 从 栈 底 于 显示 栈 中 每 个 元 素 
栈 有 两 种 存储 方式 ,顺序 存储 (顺序 栈 ) 和 链 式 存储 ( 链 栈 )。 在 实际 应 用 中 ， 以 顺序 存储 
的 栈 为 主 ， 故 下 面 主要 介绍 顺序 栈 。 e 
So aN 


3.1.3 PARTO EN Za 
1， 栈 的 顺序 存储 


顺序 栈 类 似 于 顺序 表 ， 用 一 维 数组 来 存放 栈 中 元 素 ， 栈 底 一 般 固定 设 在 下 标 为 0 的 一 
端 ， 用 一 个 变量 top 指示 当前 栈 项 元 素 所 在 单元 的 位 置 。 

通常 情况 下 ， 把 空 栈 的 判定 条 件 定位 为 totp=-1， 当 栈 中 有 一 个 元 素 时 ，top=0， 而 栈 
满 时 ，top=MAXSIZE-1， 栈 的 长 度 等 于 top+1。 示 意图 如 图 3.3 所 示 。 其 进出 栈 的 实现 见 
算法 3.1 和 算法 3.2。 
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(a) HA (b) Hea (c) 栈 满 


433 ”顺序 栈 示意 图 
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顺序 栈 的 结构 定义 如 下 。 





2， 栈 的 运算 实现 
1) 初始 化 栈 


建立 一 个 新 的 空 栈 S$， 实际 上 将 栈 项 指针 指向 -1 即 可 。 
算法 3.1_ 栈 的 顺序 存储 的 初始 化 操作 。 







2) ER OK 
清空 栈 中 的 元 素 ， sanama 
WA 3.2 HRIUYTENANE uth 


3) 判断 栈 是 否 为 空 
判断 栈 是 否 为 空 时 ， 若 栈 5 为 空 栈 ， 则 返回 TRUE， 否 则 返回 FALSE. 
算法 3.3 ” 栈 的 顺序 存储 的 判 空 操作 。 





4) 求 栈 的 长 度 。 
返回 5 的 元 素 个 数 ， 即 栈 的 长 度 。 
算法 3.4， 栈 的 顺序 存储 求 栈 的 长 度 操 作 。 





Qs 
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5) 返回 栈 项 元 素 
若 栈 不 空 ， 则 用 e 返回 8 的 栈 顶 元 素 ， 并 返回 TRUE: 否则 返回 FALSE. 
算法 3.5“ 栈 的 顺序 存储 返回 栈 项 元 素 操 作 。 







6) 显示 元 素 Ñ 
MRKAR TRA BAAR AE A TERE <u 
WASG NNUAL RTC, O 





7) 入 栈 操作 

对 于 栈 的 插入 ， 即 入 栈 操作 ， 其 算法 执行 步骤 描述 如 下 。 

(D 判断 栈 是 否 已 满 。 

(2) 如 果 栈 没 满 ， 则 让 栈 项 指针 上 移 。 

(3) 数据 元 素 入 栈 。 

实际 上 , 就 是 做 了 如 图 3.2 和 图 3.3 所 示 的 处 理 ， 对 于 入 栈 操作 push, HATER e 为 新 
的 栈 顶 元 素 ， 其 算法 实现 代码 如 下 . 

算法 3.7 ” 栈 的 顺序 存储 的 入 栈 操作 。 


ee a 


BIBI BERD C ’) 


{ printi (hie analy) a 
return FALSE; 
} 


return TRUE; 
} 


8) 出 栈 操作 

出 栈 操作 算法 的 执行 步骤 描述 如 下 。 
(1) 判断 栈 是 否 为 空 。 

(2) 如 果 栈 不 为 空 ， 则 取出 栈 项 元 素 值 。 
G) 栈 项 指针 下 移 。 





出 栈 操作 pop， 若 栈 不 空 ， 则 删除 S 的 栈 项 元 素 ， 用 e 返回 


返回 ERROR， 其 算法 实现 源 程序 代码 如 下 。 
算法 3.8 ” 栈 的 顺序 存储 的 出 栈 操作 . 


int Pop(SqStack *S, int *e) 


N 
if (S->top==-1) 
{ printé ("#&25!"); > x, 
return FALSE; R 
} NE 
*e=S->data[S->top] // 将 要 删 顶 元 素 赋值 给 e 
栈 项 指 


} 
ee AI aT LAA ti ARIA 


S->top--; // 
return TRUE; 小 


是 先 取出 原 栈 项 元 素 后 才 移动 栈 项 指针 .下 所 
J 
3.1.4 用 栈 实现 的 迷宫 问题 





迷宫 问题 的 求解 可 以 采用 回溯 法 ， 即 一 种 不 断 试探 且 及 时 纠 





S->topt+; // 栈 顶 指 针 增加 1 
S->data[S->top]=e; // 将 新 插入 的 元 素 赋值 给 栈 项 空间 











其 值 ， 并 返回 TRUE; 否则 








QN 


硕 指针 而 后 插入 元 素 ， 出 栈 





E 错 误 的 搜索 方法 。 其 思想 如 


下 : 从 迷宫 入 口 出 发 ， 按 某 一 方向 向 前 探索 ， 若 能 走 通 (未 走 过 的 )， 即 某 处 可 以 到 达 ， 则 到 达 
新 点 ， 否 则 试探 下 一 方向 :车 所 有 的 方向 均 没有 通路 ， 则 沿 原 路 返回 前 一 点 ， 换 下 一 个 方向 继 


续 试探 ， 直 到 所 有 可 能 的 通路 都 探索 到 ， 或 找到 一 条 通路 ， 或 无 路 可 走 又 返回 到 入 口 点 。 























在 求解 过 程 中 ， 为 了 保证 在 到 达 某 一 点 后 不 能 向 前 继续 行走 (无 路 ) 时 ， 能 正确 返回 前 








一 点 以 便 继续 从 下 一 个 方向 向 前 试探 ， 则 需要 月 





1) 表示 迷宫 的 数据 结构 








示 通 路 ，1 表示 不 通 。 当 从 某 点 向 前 试探 时 ， 中 




















周围 是 墙壁 这 一 实际 问题 相 一 致 。 














Ye 


到 达 该 点 的 方向 。 因 此 ， 需 要 解决 以 下 四 个 问题 。 


WSH m íT n 列 ， 利 用 maze[m][n] 来 表示 一 个 迷宫 ， 








个 栈 保存 所 能 够 到 达 的 每 一 点 的 下 标 及 


maze[i][jJ=0 或 1， 其 中 ，0 表 








间 点 有 八 个 方向 ( 见 图 3.4(b)) 可 以 试探 ， 而 








个 角 点 有 三 个 方向 ， 其 他 边缘 点 有 五 个 方向 。 为 使 问题 简单 化 ， 我 们 用 maze[m+2][n+2] 
来 表示 迷宫 ， 即 在 迷宫 四 周 设立 “哨兵 ” 则 迷宫 四 周 的 值 全 部 为 1。 这 样 将 使 问题 简单 化 ， 
每 个 点 的 试探 方向 全 部 为 8， 不 用 再 判断 当前 点 的 试探 方向 有 几 个 ， 同 时 “哨兵 ”与 迷宫 
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出 口 6，8) 
(a) 用 mazelm+21[n+2| 表 示 的 迷宫 
(xl, y) 0 


(el. 1) | Cl, y+) 


alias 2 

(x, y-1) < 一 一 —— (x, p+) S5 
s | Si w») Ó S} i 
(Hl, y) E Do s 


(b) 与 点 (x， ‘gg O O 增 量 数组 move 
yi m seh 


图 3.4(a) 表 示 的 是 一 Ay 6X 的 迷 富 。 areni hs 出 口 坐标 为 6，8)， 则 
的 定义 如 下 。 X- 


#define is ain 
#def 8 际 列 数 


int maze [m+2] [n+2]; eee 
2) 试探 方向 


(xtl, yD) 














该 迷宫 


在 上 述 表示 迷宫 的 情况 下 ， 每 个 点 有 八 个 方向 去 试探 ， 与 其 相 邻 的 八 个 点 的 坐标 都 可 








根据 与 该 点 的 相对 方位 而 得 到 。 试 探 顺 序 规定 为 ， 从 当前 位 置 向 前 试探 的 方向 为 从 正 东 沿 


顺 时 针 方 向 进行 。 为 了 简化 问题 ， 将 从 正 东 开始 沿 顺 时 针 进 行 的 这 八 个 方向 的 坐标 





增 量 顺 


序 存 放 在 一 个 结构 数组 move[8] 中 ， 在 move 数组 中 ， 每 个 元 素 由 两 个 域 组 成 ，x 是 横 坐 标 

















WE, y 是 纵 坐 标 增 量 。move 数组 如 图 3.3(c) 所 示 ， 则 定义 如 下 


typedef struct 
{ 

ET xiy 
}Item; 
Item move[8] ; 


这 样 可 以 很 方便 地 求 出 从 某 点 (x，y) 按 某 一 方向 VON VST) SA MTG, A 


i=x+move[v].x; j=y+move[v].y; 





BER: 


数据 结构 (语言 的) C ”) 


3) 栈 的 设计 

当 到 达 了 某 点 而 无 路 可 走时 需 返 回 前 一 点 ， 再 从 前 一 点 开始 沿 下 一 个 方向 继续 试探 。 
此 ， 压 入 栈 中 的 不 仅 要 有 顺序 到 达 的 各 点 的 坐标 ， 还 要 有 从 前 一 点 到 达 本 点 的 方向 。 

栈 中 每 一 组 数据 是 所 到 达 的 每 点 的 坐标 及 从 前 一 点 到 达 本 点 的 方向 。 对 于 图 3.3 所 示 
的 迷宫 ， 走 的 路 线 为 : (1，Di 一 2，2)i 一 3，3)i 一 3，4)o 一 3，5)o 一 3，6)o 一 3，7)o( 下 脚 
标 表 示 方 向 )， 当 从 点 3，6) 沿 方向 0 到 达 点 3，7) 之 后 ， 无 路 可 走 ， 则 应 回溯 ， 即 退回 到 
点 (3，6)。 对 应 的 操作 是 出 栈 ， 沿 下 一 个 方向 ， 即 方向 1 继续 试探 ， 方 向 1、2 试探 失败 ， 
在 方向 3 上 试探 成 功 ， 即 到 达 了 (4，5) 点 ， 因 此 将 (4，5，3) 压 入 栈 中 ， 再 继续 向 前 搜索 。 
最 后 将 66，8，2) 压 入 栈 中 ， 因 为 已 到 达 出 口 ， 找 到 了 一 条 出 路 ， 所 以 算法 结束 。 
此 ， 栈 中 元 素 是 一 个 由 行 、 列 、 方 向 组 成 的 三 元 组 ， 设 计 如 下 。 































































































typedef struct 
{ 


int x,y,d; 。 // 横 纵 坐标 及 方向 a = 





}SElemType; 
顺序 栈 类 型 定义 为 如 下 。 
typedef struct wr 
{  SElemType stack[STACK signa 
int top; Ki 
}SqStack; // 定义 顺 
ta ke 次 | 
4) 如 何 避 免 发 生死 循环 - 了。 
避免 发 生死 循环 有 WOW ee AN mark[m][n]， 将 它 的 所 有 
元 素 都 初始 化 为 0， 一旦 有 到 达 了 某 一 点 (， 刀 ， 就 使 mark[a 四 置 1， 下 次 再 试探 这 个 位 置 时 就 不 
能 继续 往 前 了 ; 法 是 ， 当 到 达 某 点 (站 后 ;maze[ 中 置 -1， 以 便 区 别 不 同 的 点 ， 同 
PUREDDKKER SANTI. FRODA FNE, SULKSENTTHRIUREN. 
迷宫 求解 ee Fe 
(1) 栈 初始 化 。 


(2) 将 入 口 点 坐标 及 到 达 该 点 的 方向 ( 设 为 -D 入 栈 , 初始 搜索 方向 dd 为 第 一 个 搜索 方向 0。 

(3) 若 栈 不 空 ， 重 复 如 下 操作 。 

© 取 栈 项 元 素 。 

@ 从 栈 项 元 素 对 应 的 顶点 开始 , 依次 试探 各 个 没有 考查 过 的 方向 ,直至 找到 一 个 可 行 
顶点 或 无 可 行 顶 点 为 止 。 若 有 ， 则 将 其 入 栈 ， 再 初始 搜索 方向 dd 为 第 一 个 搜索 方向 0， 若 
此 时 已 到 达 出 口 ， 说 明 已 找到 一 条 路 径 ， 输 出 该 路 径 ， 算 法 结束 ; 若 没有 可 行 项 点 ， 出 栈 ， 
退回 到 上 一 步 ， 搜 索 方向 dd 为 上 一 次 搜索 的 下 一 个 方向 。 

(4) 若 最 后 栈 为 室 ， 则 表明 没有 出 路 ， 搜 索 失 败 ; 栈 非 空 ， 表 明 搜 索 成 功 ， 搜 索 路 径 
上 的 顶点 放 在 栈 5 中。 最 后 ， 栈 中 保存 的 就 是 一 条 迷宫 的 通路 。 
程序 实现 如 下 。 
#include <stdio.h> 
#include <stdlib.h> 
#define m 6 // 迷宫 的 实际 行 
#define n 8 // 迷宫 的 实际 列 























A> 
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数据 结构 (C 语言 版 ) ( )) 


ve = 
S9 pe 独立 实践 


i 在 本 例 中 ， 采 用 栈 结 构 用 回溯 法 探索 迷宫 路 径 ， 过 程 比较 清晰 ， 但 只 能 找到 所 有 可 能 
的 路 径 中 的 一 条 。 请 尝试 修改 本 例 的 算法 ， 以 便 求 出 所 有 可 行 的 路 径 。 


3.2 M J 
ÑA amsi 
银行 排队 叫 号 问题 
在 以 银行 营业 大 厅 为 代表 的 窗口 业务 中 ， ee 
位 改善 服务 品质 、 提 升 企业 形象 的 主要 障碍 。 排 队 叫 号 系统 | 用 将 成 为 改变 这 种 情况 的 
有 力 手段 。 ls 票 进 队 、 排 队 等 待 、 叫 号 服务 
等 功能 ， e en 拥挤 和 混乱 现象 。 
3.2.1 队列 的 概念 


队列 (Queue) 又 是 一 种 运算 受 enn iS 它 只 允许 在 表 的 一 端 进行 插入 ， 而 在 另 一 
端 进行 删除 。 允 许 插 入 元 素 的 一 尾 (Rear)， 人 允许 删除 元 素 的 一 端 称 为 队 头 (Front); 
不 信 元 素 的 空 表 称 为 空 队列 二 间 队 列 添加 元 素 称 为 Bh ADOF BCBS. 由 
于 新 入 队 的 元 素 只 能 添加 到 队 尾 ， 出 队 的 元 素 只 头 的 元 素 ， 所 以 队列 的 特点 是 先 
进入 队列 的 元 素 先 出 队 y 改 队列 也 称 为 先进 先 sR. ROU 

在 日 常生 活 中 有 很 多 这 样 的 例子 ， 如 移动 、 联 通 、 电 信 等 客服 电话 ， 客 服 人 员 与 客户 
相 比 总 是 少数 入 在 所 有 的 客服 人 员 都 占线 的 情况 下 ， 客 户 会 被 要 求 等 待 ， 直 到 有 某 个 客服 
ARI, A 先 等 待 的 客户 接 通电 话 。 这 里 就 是 将 所 有 当前 拨打 客服 电话 的 客户 进 
行 了 排队 处 理 。 假 设 队列 是 gq=(a1，a2，…，ay)， 那 么 ay 就 是 队 头 元 素 ， 而 a 就 是 队 尾 元 
素 。 这 样 就 可 以 在 删除 时 ， 总 是 从 a 开始 ， 而 插入 时 ， 列 在 最 后 ， 如 图 3.5 所 示 。 











图 3.5 队列 
3.2.2 ”队列 的 基本 操作 
队列 的 基本 操作 主要 包括 如 下 几 部 分 。 
InitQueue (&Q) // 初 始 化 空 队列 @ 
ClearQueue (&Q) // 释 放 栈 2 占用 的 存储 空间 
QueueEmpty (Q) // 判 断 队 列 是 否 为 空 
QueueLength (Q) // 返 回 队列 的 长 度 
GetHead (Q, £e) //Ħ e 32E o 的 队 头 元 素 
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EnQueue (40, e) // 将 元 素 e 入 队 作为 队 尾 元 素 
DeQueue (&Q, &e) // 从 队列 中 出 队 一 个 元 素 , 用 e 返回 
QueueTraverse (Q) // 从 队 头 到 队 尾 依次 对 队列 o 中 每 个 元 素 输出 


队列 也 有 两 种 存储 方式 : 顺序 存储 (顺序 队列 ) 和 链 式 存储 ( 链 队列 )。 
3.2.3 ”队列 的 顺序 存储 、 实 现 和 应 用 





1. 顺序 队列 


顺序 存储 的 队列 称 为 顺序 队列 。 顺 序 队列 类 似 于 顺序 表 ， 用 一 维 数组 来 存放 队列 元 素 ， 
实际 上 就 是 运算 受 限 的 顺序 表 。 但 由 于 队 头 和 队 尾 都 是 活动 的 ， 因 此 ， 设 有 两 个 指针 ， 队 
头 指针 (front) 和 队 尾 指针 (rear)。 为 方便 起 见 ， 我 们 规定 队 头 指针 front 总 是 指向 当前 队 头 元 
素 的 位 置 ， 队 尾 指针 rear 指向 当前 队 尾 元 素 的 后 一 位 置 ， 如 图 316 世 示 。 
A cami ean 尾 指针 均 为 0, 即 front 
= rear = 0。 每 当 插入 新 的 队列 尾 元 素 时 ,“ 尾 指针 每 当 删除 队 头 元 素 时 ,“ 头 指针 
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front=rear=0 front=0,rear=3 front=0,rear=10 front=5,rear=9 front=5,rear=10 
(a) 空 队 (b) 有 多 个 元 素 (0) 队 满 情况 (d) 一 般 情况 (c) ABLE 
图 3.6 ”队列 操作 示意 图 
顺序 队列 的 存储 结构 定义 如 下 。 


#define MAXSIZE 100 
typedef int DataType; 
typedef struct 

{ DataType data [MAXSIZE]; 





int front; // 头 指针 
int rear; // 尾 指针 , 若 队列 不 空 , 则 指向 队列 尾 元 素 的 下 一 个 位 置 
}SqQueue; 





图 3.7 中 说 明了 在 顺序 队列 中 进行 出 队 和 入 队 运 算 时 队列 中 的 元 素 及 头 尾 指针 的 变化 
情况 。 一 开始 ， 队 列 的 头 、 尾 指针 都 指向 向 量 空间 下 标 为 0 的 位 置 ， 若 不 考虑 溢出 ， 则 入 


队 运算 可 描述 为 ; 





sq->data[sq->rear]=x; /* x 入 队 */ 


sq->rear++; /* 尾 指 针 加 1 */ 
出 队 运 算 可 描述 为 : 
sq->frontt+t+; /* 头 指 针 加 1 */ 





显然 ， 当 前 队列 中 的 元 素 个 数 ( 即 队列 的 长 度 ) 是 (sq->rear)- (sq->front)。 若 
sq->front=sq->rear， 则 队列 长 度 为 0， 即 当前 队列 是 空 队列 ， 如 图 3.6(a) 表 示 空 队列 。 空 队 
列 时 再 做 出 队 操作 便 会 产生 “下 溢 ”。 队 满 的 条 件 是 当前 队列 长 度 等 于 向 量 空间 的 大 小 , B: 


(sq->rear)- (sq->front)=MAXSIZE 


如 图 3.6(c) 所 示 ， 队 满 时 再 做 入 队 操作 会 产生 “上 汶 ”。 但 是 ， 如 果 当 前 尾 指针 等 于 向 
量 的 上 界 ( 即 sq->rear=MAXSIZE-1)， 即 使 队列 不 满 ( 即 当 前 队列 长 度 小 于 MAXSIZE)， 再 作 
入 队 操作 也 会 引起 上 滋 。 例 如 , 若 图 3.6(e) 是 当前 队列 的 状态 , 即 - IZE=10, sq->rear=10, 
sq->front=5， 因 为 sq->reart|>MAXSIZE, nr 操作 ， 但 当前 队列 并 不 满 ， 
我 们 把 这 种 现象 称 为 “ 假 上 溢 ”。 产生 该 现象 的 原因 是 元 素 的 空间 在 该 元 素 删除 以 后 
就 永远 使 用 不 到 。 为 克服 这 一 缺点 ， 可 以 在 每 次 出 队 时 将 整个 队列 中 的 元 素 向 前 移动 一 个 
位 置 ， ee ee 前 移动 直至 头 指针 为 0， 但 这 两 种 方 
法 都 会 引起 大 量 元 素 的 移动 ， ERR 很 少 采 用 。 通 常 采用 循环 队列 的 方法 来 解 
决 假 溢出 问题 。 NK 

NS 

2. 循环 队列 ,> 


MA 

设想 向 量 sq->data[ MAXSIZH] 是 一 个 aie 环 ， 即 sq->data[0] 接 在 
sq->data[MAXSIZE-1] 之 后 ， 我 们 将 这 种 意义 下 向 量 称 循 环 向 量 ， 并 将 循环 向 量 中 的 队列 称 
为 循环 队列 ， 如 图 3.7 所 示 ， 若 当前 尾 指针 等 于 的 上 界 ， 则 再 做 入 队 操 作 时 ， 令 尾 指针 等 
于 向 量 的 下 界 、 这 样 就 能 利用 到 已 被 删除 的 元 素 空间 ， 克 服 假 上 溢 现 象 。 因 此 入 队 操作 时 ， 在 
循环 意义 下 的 加 1 操作 可 描述 为 T 
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3.7 ”循环 队列 




















if (sq->rear+1>=MAXSIZE ) sq->rear=0; 
else sq->reart+; 


如 果 利用 “ 模 运算 ”， 上 述 循环 意义 下 的 尾 指针 加 1 操作 ， 可 以 更 简洁 地 描述 为 : 


Se 
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sq->rear=(sq->rear+1) % MAXSIZE 


同样 ， 出 队 操作 时 ， 在 循环 意义 下 的 头 指 针 加 1 操作 ， 也 可 利用 “ 模 运 算 ” 来 实现 : 
sq->front=(sq->front+1) % MAXSIZE 

因为 出 队 和 入 队 分 别 要 将 头 指针 和 尾 指针 在 循环 意义 下 加 1， 所 以 某 一 元 素 出 队 后 ， 
若 头 指针 已 从 后 面 追 上 尾 指针 ， 即 sq->front=sq->rear， 则 当前 队列 为 空 ， 若 某 一 元 素 入 队 
后 ， 尾 指针 已 从 后 面 追 上 头 指 针 ， 即 sq->rear=sq->front， 则 当前 队列 为 满 。 因 此 ， 仅 赁 等 
式 sq->front=sq->rear 是 无 法 区 别 循环 队列 是 空 还 是 满 的 。 对 此 ， 有 两 种 解决 的 办 法 : 其 一 
是 引入 一 个 标志 变量 以 区 别 是 空 队 还 是 满 队 ;， 另 一 种 更 为 简单 的 办 法 是 : 入 队 前 ， 测 试 尾 
指针 在 循环 意义 下 加 1 后 是 否 等 于 头 指针 ， 若 相等 则 认为 是 队 满 ， 即 判别 队 满 的 条 件 是 : 


(sq->rear+1) SMAXSIZE ==sq->front 


从 而 保证 了 sq>rear—sq->front 是 队 空 的 判别 条 件 。 KNE 这 里 规定 的 愉 江 条 作 
使 得 循环 向 量 中 ， 始 终 有 一 个 元 素 的 空间 ( 即 sq->data[sq- an) REIN, 即 有 MAXSIZE 个 
分 量 的 循环 向 量 只 能 表示 长 度 不 超过 MAXSIZE-1 Ra a o 
标志 而 造成 时 间 上 的 损失 。 <a 
在 循环 队列 上 实现 的 五 种 基本 运算 如 下 NA 
(1) 置 空 队 
初始 化 一 个 全 循环 队列 sg， 即将 sho 指针 和 rear 指针 设置 为 0。 
算法 3.9 ”循环 队列 的 初始 化 \、 ae 
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n > 
int Initoueue (seo a Wee magi 


“car 


(2) 判 队 空 
若 循环 队列 sq 为 空 队列 ， 则 返回 TRUE， 和 否则 返回 FALSE. 
算法 3.10 ”循环 队列 的 判 空 
int QueueEmpty (SqQueue sq) 
{ 
if (sq. front==sq. rear) /* 队列 空 的 标志 */ 
return TRUE; 
else 
return FALSE; 
} 


(3) 循环 队列 的 长 度 
返回 队列 sq 的 元 素 个 数 ， 也 就 是 队列 的 当前 长 度 。 
算法 3.11 循环 队列 的 长 度 








(4) 返回 循环 队列 的 首 元 素 
若 队 列 不 空 ， 则 用 e。 返回 sq 的 队 头 元 素 ， 并 返回 TRUE, FZE ERROR. 
算法 3.12 ”返回 循环 队列 的 首 元 素 





(5) 循环 队列 的 入 队 操作 NS 

将 待 尖 加 的 元 素 变 量 。 插 入 到 队列 sq he 需 注 意 ， 要 将 元 素 。 先 插入 到 队 尾 指针 rear 
所 指向 的 位 置 ， 再 将 队 尾 指针 rear 加 sh 

算法 3.13 ”循环 队列 的 入 队 操作 SN 






(6) 循环 队列 的 出 队 操 作 

当 从 队列 删除 元 素 时 ， 队 头 指针 front 后 移 而 队 尾 指针 rear 不 动 ， 做 出 队 运算 时 ， 假 设 
要 求 将 出 队 的 元 素 值 赋 给 变量 e。。 若 队列 不 空 ， 出 队 操作 是 先 把 被 删除 的 队 头 元 素 ， 用 e 
返回 其 值 ， 再 将 队 头 指针 加 1， 表 明 队 头 元 素 出 队 。 

算法 3.14 ”循环 队列 的 出 队 操作 





Qs 





(7) 循环 队列 的 遍历 


从 队 头 到 队 尾 依次 输出 队列 sq 中 每 个 元 素 。 
算法 3.15 循环 队列 的 元 素 显示 





7 AS 
se ie 我 们 发 现 单 是 顺序 存储 、 若 不 是 循环 队列 ， 算 法 的 时 间 性 能 是 不 高 的 ， 
但 循环 队列 又 面临 着 数组 可 能 会 洲 出 的 问题， 所 以 可 以 用 链 式 存储 结构 来 实现 队列 。 


3.2.4 ”队列 的 链 式 存储 、 实 现 和 应 用 
1， 队 列 的 链 式 存储 结构 


队列 的 链 式 存储 结构 称 为 链 队列 。 链 队列 的 结构 和 各 种 基本 操作 均 类 似 于 线性 链表 ， 
只 是 要 注意 它 的 插入 和 删除 操作 受 限 ， 只 允许 在 队 尾 插入 、 队 头 删除 。 所 以 链 队列 其 实 就 
是 只 允许 尾 进 头 出 的 单 链表 。 为 了 操作 上 的 方便 ， 我 们 将 队 头 指针 指向 链 队 列 的 头 结 点 ， 
而 队 尾 指针 指向 终端 结 点 ， 如 图 3.8 所 示 。 


ESSN CEN 以 尾 bint 
“}-EG-- — -E 
rear rear 


(a) 非 空 链 队 (b) 空 链 队 
图 3.8 链 队列 示意 图 
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链 队列 的 结构 定义 如 下 。 





Lik 
2， 链 队列 的 操作 实现 AN 








1) 链 队 的 入 队 
入 队 操 作 就 是 在 链表 的 尾部 插入 结 点 ， 如 












、 
yy oy 链 队 的 入 ae 


WD TEA e O MIE, 则 该 链 队 eae 
算法 3.23 ” 链 队 的 入 队 操作 。 j F 





2) 链 队 的 出 队 
出 队 操 作 就 是 头 结 点 的 后 继 结 点 出 队 ， 将 头 结 点 的 后 继 改 为 它 后 面 的 结 点 ， 如 图 3.10 
所 示 。 


Qs 


(O 第 3 章 能 与 队列 





(o 
front 
in 
is OF cnet 
(a) 一 般 结 点 出 队 (b) 只 有 一 个 结 点 a 的 出 队 





63.10 链 队 的 出 队 
当 链 表 除 头 结 点 外 只 剩 下 一 个 元 素 时 ， 则 需 将 rear 指向 头 结 点 ， 如 图 3.10(b) 所 示 。 若 
队列 不 空 ， 则 删除 O 的 队 头 元 素 ， 用 e 返回 其 值 ， 并 返回 TRUE; 否则 ， 返 回 FALSE， 如 
图 3.10(a) 所 示 。 其 相应 的 代码 实现 如 下 : 
算法 3.24 链 队 的 出 队 操作 。 


3) 显示 元 素 > AW 
从 队 头 到 队 尾 依次 输出 队列 O 中 每 人 于 的 代码 如 下 。 
NERENN. J 


算法 3. 





对 于 循环 队列 与 链 队列 的 比较 ， 可 以 从 以 下 两 方面 来 考虑 。 
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(1) 从 时 间 上 说 ， 它 们 的 基本 操作 都 是 常数 时 间 ， 即 都 是 O(1)， 但 是 循环 队列 是 事先 
申请 好 空间 ， 使 用 期 间 不 释放 ， 而 链 队列 每 次 申请 和 释放 结 点 也 会 存在 一 些 时 间 开 销 ， 如 
果 入 队 出 队 频繁 ， 则 两 者 还 是 有 细微 差异 的 。 

(2) 从 空间 上 来 说 ， 循 环 队列 必须 有 一 个 固定 的 长 度 ， 所 以 就 有 了 存储 元 素 个 数 和 空 
间 浪 费 的 问题 。 而 链 队列 不 存在 这 个 问题 ， 尽 管 它 需 要 一 个 指针 域 ， 会 产生 一 些 空间 上 的 
开销 ， 但 也 可 以 接受 。 所 以 在 空间 上 ， 链 队列 更 加 灵活 。 

总 的 来 说 ， 在 可 以 确定 长 度 最 大 值 的 情况 下 ， 建 议 用 循环 队列 ， 如 果 无 法 预 估 队 列 的 
长 度 ， 则 建议 用 链 队列 。 


3.2.5 ”用 队列 实现 银行 排队 叫 号 系统 


下 面 用 队列 实现 银行 排队 叫 号 系统 ， 其 主要 包括 排队 管理 、 呼 叫 客户 、 打 印 客户 信息 、 
查找 客户 、 删 除 客户 等 功能 。 as 
(1) 用 链 队 列 存储 客户 信息 的 定义 如 下 。 ix 
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Q = ik 与 队列 
© = 


scanf ("%s",name); 
_flushall(); 
if (Delete (Q, name) ==1) 
printf ("已 取消 \n"); 
else 
printf ("未 找到 该 人 \n"); 


break; 





default: 
printf ("选择 错误 , 请 重新 选择 。\n"); 


break; 


ep aN 
PÈ aran A gS 


VY 
上 例 中 优先 级 高 的 用 户 将 直接 加 到 ania 因此 只 用 了 一 个 队列 ， 请 试 着 用 两 个 
队列 来 实现 优先 功能 ， 即 优先 的 客户 Seek 正常 的 客户 进 正常 队列 ， 


RS 结 a 


本 章 主要 介绍 栈 与 sian, carat 链 式 存储 表示 与 基本 操作 。 

栈 是 仅 在 表 的 一 端 进 行 插入 和 删除 运 表 , 又 称 为 后 进 先 出 表 (LIFO 表 )。 插入、 
删除 端 称 为 栈 项 ， 另 把 端 称 为 栈 底 。 es 当 栈 满 时 ， 做 入 栈 运算 必定 产 
生 空间 溢出 , 称 为 “上 浇 ”。 当 栈 空 时 ， 做 出 栈 运算 必定 产生 空间 溢出 ， 称 “下 滋 ”。 上 浇 
是 一 种 错误 应 设法 避免 ， 下 滋 常 用 作 程序 控制 转移 的 条 件 。 

队列 是 一 种 运算 受 限 的 线性 表 ， 人 允许 删除 的 一 端 称 为 队 首 ， 允 许 插入 的 一 端 称 为 队 尾 。 
队列 又 称 为 先进 先 出 线性 表 (FIFO 表 )。 顺 序 队 列 中 存在 “ 假 上 溢 ” 现 象 ， 入 队 和 出 队 操 作 
使 头 尾 指针 只 增 不 减 ， 导 致 被 删 元 素 的 空间 无 法 利用 ， 队 尾 指针 超过 向 量 空间 的 上 界 而 不 
能 入 队 。 为 克服 “ 假 上 溢 ” 现 象 ， 将 向 量 空间 想象 为 首尾 相连 的 循环 向 量 ， 存 储 在 其 中 的 
队列 称 为 循环 队列 。 

















J ww 
一 、 填 空 题 
1. RE 的 线性 表 ， 其 运算 遵循 的 原则 。 
2. 当 两 个 栈 共享 一 个 存储 区 时 ， 栈 利用 一 维 数组 s[N] 表 示 ， 两 栈 顶 指针 为 topl 与 
top2( 栈 项 指针 均 指 向 当前 栈 顶 元 素 所 在 单元 的 位 置 )， 则 当 栈 1 空 时 , top1 为 » BE 
2 IN, top? 为 ， 栈 满 时 为 
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. FS 表示 入 栈 操作 ， 针 表示 出 栈 操作 ， 若 元 素 入 栈 的 顺序 为 1234， 为 了 得 到 1342 
F, FINE S 和 丈 的 操作 串 为 
序 栈 用 data[M] 存 储 数据 ， 栈 顶 指针 是 top( 栈 顶 指针 指向 当前 杰 顶 元 素 所 在 单元 的 
值 为 x 的 元 素 入 栈 的 操作 是 
下 标 0 开始 的 N 元 数组 实现 循环 队列 时 ， 为 实现 下 标 变量 M 加 1 后 在 数组 有 效 
内 循环 ， 可 采用 的 表达 式 是 M= ” 
. 已 知 链 队 的 头 尾 指 针 分 别 是 /和 r 则 将 值 x 入 队 的 操作 序列 是 
7. 区 分 循环 队列 的 满 与 空 有 两 种 方法 ， 它 们 是 和 
8. 循环 队列 引入 的 目的 是 克服 
9. 一 个 栈 的 输入 序列 是 1，2，3， 则 不 可 能 的 栈 输 出 序列 是 
10， 队 列 是 插入 只 能 在 表 的 一 端 ， 而 删除 在 表 的 另 一 端 进行 的 线性 表 ， 其 特点 是 
Ks 
二 、 选 择 题 AN 
.在 做 入 栈 运算 时 ， 应 先 判别 栈 是 否 ( en 出 栈 运算 时 应 先 判 别 栈 是 否 
( @ en ee ee A Je 


te 个 栈 共享 一 片 连续 的 内 存 空间 ， 将 
两 栈 的 ( ME N D, S O ) 时 ， 才 会 产生 上 洲 。 








































































O, ©: A. 空 B. wR) c. bii D. Föt 
@: A. rl ERN el AN D. n/2 
@: A. 长 度 > ae D. 栈 底 
©: A. 两 个 we 

B. 其 中 R MAER EN 中 心 点 
(on , PUARE TATE RENE 置 相遇 


个 栈 均 不 空 ， 且 一 个 的 税 项 到 达 另 个 和 的 杰 底 
2 一 不 入 序列 为 1 ， 2，3，…，m， 若 输出 序列 的 第 一 个 元 素 是 n， 输 出 第 i(1 
Sin ATK e 
A. 不 确定 B. n-i+l Cx 4 D. ni 
3. 若 一 个 栈 的 输入 序列 为 1，2，3，…，m， 输 出 序列 的 第 一 个 元 素 是 i， 则 第 j 个 输 
出 元 素 是 ( 。 )。 








A. ij- B. ij C. ijt D. 不 确定 的 
4. 有 六 个 元 素 7，6，5，4，3，2，1， 从 7 开始 顺序 进 栈 ， 则 下 列 ( PEAR 
出 栈 序列 。 


A. 7543612 B. 4531267 C. 7346521 D. 2341567 
5. 设 一 个 栈 的 输入 序列 是 1, 2, 3, 4, 5, 则 下 列 序列 中 , 栈 的 合法 输出 序列 的 是 (  )。 
A. 51234 B. 45132 Cc. 43125 D. 32154 
6. 若 栈 采用 顺序 存储 方式 存储 ， 现 两 栈 共享 空间 Vm] top RRE i R=, 24k 
顶 ， 栈 1 的 底 在 v[0]， 栈 2 的 底 在 Vm-1]， 则 栈 满 的 条 件 是 ( 。“)。 
A. top[2]-top[1]=0 B. top[1]+1=top[2] 
C. top[1]+top[2]=m D. top[1]=top[2] 


>) 
— ESMI 
© = 
7. 执行 完 下 列 语句 段 后 ,i 值 为 (  ). 


int fl(int x) 
{ return ((x>0) ? x* £(x-1):2); } 


























int i; 
L SEELY: 
A. 2 B. 4 C. 8 D. 无 限 递归 
8. 用 链接 方式 存储 的 队列 (不 带头 结 点 )， 在 进行 删除 运算 时 ( 。”)。 
A. 仅 修 改 头 指针 B. 仅 修 改 尾 指针 
C. 头 、 尾 指针 都 要 修改 D. 头 、 尾 指针 可 能 都 要 修改 
9. 假设 以 数组 4[m] 存 放 循环 队列 的 元 素 ， 其 头 尾 指 针 分 别 为 font 和 rear， 则 当前 队 
列 中 的 元 素 个 数 为 ( 。 )。 伦 
A. (rear-front+m)%m B. rear-front+ 
C. (front-rear+m)%m D. (rear- ON 





10. 若 用 一 个 大 小 为 6 的 数组 来 实现 循环 队列 Bi rear 和 front 的 值 分 别 为 0 和 3， 
当 从 队列 中 删除 一 个 元 素 ， 再 加 入 两 个 元 素 后 ,ieir 和 fiont 的 值 分 别 为 ( )。 
A. 1 和 5 B. 2 和 4 > XC\4 M2 D. 5 和 1 
11. 设 栈 S 和 队列 O MARAIS, TOR er en ey ep es 和 es 依次 通过 栈 5， 一 
个 元 素 出 栈 后 即 进入 队列 O， 若 队 的 序列 是 es es, es eg es ep MII S 的 
容量 至 少 应 该 是 )。 OS XS 
A. 6 ,Bg oy,” D. 2 
Xy 


三 、 简 答题 ay eS 


Ne 
BERR, MIRAR? 

， 简 述 栈 的 入 栈 、 出 楼 操作 的 过 程 。 

， 在 循环 队列 中 简 述 入 队 、 出 队 操作 的 过 程 。 

.在 什么 情况 下 ， 才 能 使 用 栈 、 队 列 等 数据 结构 ? 


四 、 应 用 题 


1. 设计 算法 判断 一 个 算术 表达 式 的 圆 括 号 是 否 正确 配对 。( 提 示 : 对 表达 式 进 行 扫描 ， 
JGB C MAER, E “)” 就 退 掉 栈 项 的 “(”， 表 达 式 扫描 完毕 ， 栈 应 为 空 ， 否 则 ， 圆 括号 
不 配对 。) 

2. 假设 以 带头 结 点 的 循环 链表 表示 队列 ， 并 且 只 设 一 个 指针 指向 队 尾 元 素 结 点 (不 设 
头 指 针 )， 请 编写 相应 的 置 空 队 、 入 队列 和 出 队列 的 算法 。 

3. 在 某 程序 中 ， 有 两 个 栈 共享 一 个 一 维 数组 空间 SPACE[N]，SPACE[0]、SPACE[N-1] 


分 别 是 两 个 栈 的 栈 底 。 





wm 上 上 wm 一 











(1) 对 栈 1、 栈 2， 试 分 别 写 出 (元 素 x) 入 栈 的 主要 语句 和 出 栈 的 主要 语句 。 
(2) 对 栈 1、 栈 2， 试 分 别 写 出 栈 满 、 栈 空 的 条 件 。 
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4. 如 果 用 一 个 循环 数组 qf[m] 表 示 队 列 时 ， 该 队列 只 有 一 个 队列 头 指针 front， 不 设 队 
列 尾 指针 rear， 而 改 置 计数 器 count 用 以 记录 队列 中 结 点 的 个 数 。 
(1) 编写 实现 队列 判 室 、 入 队 、 出 队 的 三 个 基本 运算 算法 。 
(2) 队列 中 能 容纳 元 素 的 最 多 个 数 是 多 少 ? 
5， 设 输入 元 素 为 1、2、3、P 和 A， 输 入 次 序 为 123PA。 当 所 有 元 素 均 到 达 输 出 序列 
有 哪些 序列 可 以 作为 高 级 语言 的 变量 名 。 
6. 假设 以 数组 Sq[MAX] 存 放 循 环 队 列 的 元 素 , 同时 设 变 量 rear 和 len 分 别 指示 循环 队 
列 中 队 尾 元 素 的 位 置 和 内 含 元 素 的 个 数 。 请 给 出 判别 此 循环 队列 的 队 满 条 件 ， 并 写 出 相应 
的 入 队列 和 出 队列 的 算法 。 


后 
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在 程序 开发 中 ， 经 常 碰 到 各 类 字符 串 (以 下 简称 $ 如 在 很 多 应 用 程序 中 经 常 要 
传输 用 户 注册 的 相关 信息 ， 当 用 户 把 数据 提交 到 通常 使 用 的 就 是 串 操作 ， 这 时 
需要 对 所 输入 的 字符 串 进行 分 析 。 


~ 


4.1 与 基本 运算 


4.1.1 串 的 类 型 定义 ae 


串 是 由 零 个 或 多 个 的 有 限 序列 。 于 
S="coclc2...Corl 


其 中 ， a core ERE: c(OSiSn-I) EPR, RK 
称 





其 他 字符 ; 串 值 的 定 界 符 ， 不 是 串 的 一 部 分 ， 串 字符 的 数目 称 为 串 的 长 度 。 

零 个 字符 为 空 串 ,通常 以 两 个 相 邻 的 双 引号 来 表示 空 串 ， 如 s=", 它 的 长 度 为 零 。 

注意 : 要 区 分 空 串 和 空格 串 (也 称 空白 串 )， 空 格 串 仅 由 空格 组 成 ， 如 s="", 长 度 不 为 零 。 

串 中 任意 个 连续 字符 组 成 的 序列 称 为 该 串 的 子 串 ， 包 含 子 串 的 串 被 称 为 主 串 ， 通 常 将 
子 串 在 主 串 中 首次 出 现时 的 该 子 串 的 首 字符 对 应 的 主 串 中 的 序号 ， 定 义 为 子 串 在 主 串 中 的 
序号 (或 位 置 )。 

例如 ， 有 两 个 串 4 和 B。 

A="This is a string." 

B="is" 

GY, BARFE, BEA 中 的 序号 是 3 而 不 是 6。 

特别 地 ， 空 串 是 任意 串 的 子 串 ， 任 意 串 是 其 自身 的 子 串 。 

当 且 仅 当 两 个 串 的 值 相等 时 称 这 两 个 串 是 相等 的 。 也 就 是 说 ， 只 有 当 两 个 串 的 长 度 相 
等 ， 并 且 各 个 对 应 位 置 的 字符 都 相等 时 这 两 个 串 才 相等 。 


41.2 上品 的 基本 运算 
串 常用 的 基本 运算 主要 包括 如 下 几 种。 





数据 结构 (C 语言 版 ) ( ”) 


ee ee z d 


假设 用 大 写字 母 S、T 等 表示 串 ， 用 小 写字 母 表示 组 成 串 的 字符 ， 并 且 假 设 : 





























(1) 赋值 (StrAssign) 
StrAssign(S，*chars) 给 串 s 赋值 ， 其 中 *chars 可 为 串 变 量 、 串 常量 或 经 过 适当 运算 所 得 
到 的 串 值 ， 生 成 一 个 其 值 等 于 字符 串 常量 chars 的 串 S。 例 如 : 
StrAssign(S, " abc" ); 
StrAssign(S, Sı); 
StrAssign(S, ""); 
(2) 联接 (Strcat) 
Strcat(S1，S;>) 就 是 将 串 Sp 紧 接着 放 在 串 Si a ETON Sio 
例如 : 


Strcat (S1, S2); eR 


则 Si="aia2*…anbib2*…bm" SN 
请 思考 Strcat(s;，s1) 的 结果 ， meee 

(3) 求 串 长 (Strlen) 

Swlen(S) ARIE S MEE e ae tesan Si 


例如 : , 1K 
Strlen E 以 
fee: abe” Sv 


2 )=0 WY 
(4) — 


Substr(S，pos，len，Sub) 表 示 在 串 S 中 截取 从 第 pos 个 字符 开始 的 连续 len 个 字符 ， 构 
成 一 个 新 串 Sub。 其 中 参数 应 满足 : 


1<pos<Sstrlen(S),1<len<strlen(s)—pos+1 











例如 : 

SubStr ("abcd",2,2,Sub); 
SubStr ("aj,a2..a,",i,j,Sub); 

有 时 对 参数 len 的 限制 可 以 放宽 到 len=O, M len=0， 规 定 对 任何 串 S， 有 Substr (S, 
pos，0，Sub)， 得 到 Sub=""; “4 len>Strlen(S)-post1 时 ， 规 定 取 S 的 第 pos 个 字符 直到 S 
的 最 后 一 个 字符 作为 子 串 ， 该 子 串 共有 Strlen(S)-post] 个 字符 。 

(5) 比较 串 的 大 小 (Stremp) 

Strcmp(S，T) 是 一 个 函数 ， 它 的 功能 是 比较 两 个 串 S 和 T 的 大 小 ， 其 中 函数 值 小 于 
等 于 和 大 于 0 时， 分 别 表 示 S<T、S=T 和 S>T。 





O 
SI gang 


© — ~N 
串 中 可 能 出 现 的 字符 ， 依 赖 于 ASCII 码 及 国标 码 的 字符 集 ， 字 符 的 大 小 是 由 该 字符 在 
字符 集中 出 现 的 先后 次 序 确定 。 若 用 函数 ord 表示 字符 在 字符 集中 的 序号 ， 当 ord(chl)< 
ord(ch2) 时 ， 则 ch1 二 ch2。 常 用 的 字符 集 都 规定 :数字 字符 0，1，…，9 在 字符 集中 是 顺序 
排列 的 ,字母 字符 A, B, een » LRH a, b, o zz) 在 字符 集中 也 是 顺序 排列 的 。 因 此 有 : 


ord('a') <ord('b")**<ord("'z') 
Ord (MOU aorar in) Sord (ion) 


定义 了 字符 的 大 小 之 后 ， 就 可 以 定义 两 个 串 的 大 小 。 串 的 大 小 通常 是 按 字 典 序 定义 的 ， 
即 从 两 个 串 的 第 一 个 字符 起 ， 逐 个 比较 相应 的 的 字符 ， 直 到 找到 两 个 不 等 的 字符 为 止 ， 这 
两 个 不 等 的 字符 即 可 确定 串 的 大 小 。 例 如 ，"this">"there"， 这 是 因为 只 >'e。 若 找 不 到 两 个 
不 等 的 字符 ， 就 必须 由 串 长 来 决定 大 小 。 例 如 "there">"the"， 这 是 因为 两 个 串 的 前 三 个 字 
符 均一 一 相同 。 但 前 者 长 度 大 于 后 者 。 由 此 可 知 ， 两 个 串 相等 当 且 仅 当 其 长 度 相等 ， 以 及 
各 个 对 应 位 置 上 的 字符 也 相同 。 [人 

(6) 插入 (StrInsert) SS 
StrInsert(s，pos，t) 表 示 将 串 i 如 执行 StrInsert(S1，2， 





















































"abe") 后 : 


;个 
Si1="alazabcas..an" wr 
/ ~ 


(7) 删除 (StrDelete) 
StrDelete(S, pos, len) Zea JAH s 删除 第 pos 个 字符 开始 的 连续 len 个 字符 。 例 如 ， 
StrDelete(S1，3，n-3) 执 行 结果 为 : S| X 


y% 
my 4 

S,="aaza," i aia v 7K 
(8) 子 串 定位 (Index 一 -从 





Index(S, TEAR HeCEAS HTP ARAN ELPA ML, CRREEN S 中 查找 是 否 有 等 
ee eee estes ages 若 无 ， 则 函数 值 为 零 








例如 : 


Index ("abcdbc", "bc")=2 
Index ("abcdbc", "ac") =0 


有 时 ， 子 串 定位 函数 也 用 Index(S，T，pos)， 表 示 返 回 子 串 了 在 主 串 S 中 第 pos 个 字 
符 之 后 的 位 置 。 若 不 存在 ， 则 返回 零 。 
例如 : 
Index("This is a book!","is",4)=6 
(9) 置换 (Replace) 


Replace(S，T，V) 表 示 用 V 蔡 换 所 有 在 S 中 出 现 的 、 和 T 相等 的 子囊。 例如 ; 设 
S="abcdbca"，T="bc"，V="&" 则 执行 后 : 








s="a €d¢ a" 
上 述 串 运算 都 是 基本 的 ， 它 就 像 数值 计算 中 对 整 型 变量 进行 四 则 运算 那样 ， 频 繁 地 
在 串 处 理 中 ， 因 此 ， 在 引进 串 变量 的 高 级 语言 中 ， 一 般 都 作为 基本 运算 符 或 基本 内 部 函数 
来 提供 ， 当 然 提供 的 种 类 和 符号 在 各 个 语言 可 能 有 所 不 同 。 



































4.2 串 的 存储 








于 串 实际 上 是 一 种 特殊 的 线性 表 ， 它 的 元 素 仅 由 一 个 字符 组 成 ， 因 此 串 的 存储 方法 
也 就 是 线性 表 的 一 般 方法 ， 常 见 的 有 顺序 存储 和 链 式 存储 两 种 方法 。 


4.2.1 串 的 顺序 存储 


和 线性 表 的 顺序 存储 一 样 ， 串 的 顺序 存储 结构 就 是 采用 与 其 逻辑 结构 相对 应 的 存储 结 
构 ， 即 串 的 各 个 字符 按 顺序 存 入 连续 的 存储 单元 , 逻辑 上 相 邻 的 字符 在 内 存 中 也 是 相 邻 的 
有 时 称 为 顺序 串 。 
串 的 最 简单 的 程序 存储 方式 是 采用 非 紧缩 格式 ， 即 每 一 个 存储 单元 中 存放 一 个 字 节 ， 
所 占 存储 单元 数目 即 为 串 的 长 度 。 这 种 存储 结构 ， 随 机 读 / 写 串 市 接 定 的 第 i 个 字符 最 为 广 
便 ， 存 了 的 速度 最 快 。 但 每 一 个 存储 单元 本 可 以 放下 多 个 学 短 、 只 放 一 个 字符 不 能 充分 和 
存储 空间 。 AN 

和 荐 全 结构 ， 即 根据 存储 单元 的 容量 



























































给 每 个 单元 存 入 多 个 字符 ， 最 末 一 个 单元 如 果 满 ， 则 可 填充 空格 符 。 这 种 存储 结构 
从 所 占 存 储 单元 的 数目 不 能 求 出 准确 的 串 末尾 单元 可 能 是 空余 单元 )， 故 需要 对 串 的 
长 度 进行 设 定 。 Ss 

在 串 的 顺序 存储 结构 中 ， 表 示 cai 通常 有 两 种 方法 : 一 种 方法 是 设置 一 个 串 的 长 
度 参数 ， oo ee EIGA LE LOA 另 一 种 方法 是 在 串 值 
的 末尾 添加 结束 标记 "0'， 此 种 方法 的 优点 是 便于 系统 自动 实现 。 

例如 ， 定 义 一 个 串 gS s， 则 这 
s.length， 如 图 4.1 所 示 。 va YY 
cr 下 < 

0 1 3.4 5 6 7°8°9 10+ MAXSIZE-1 


MT | 
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图 4.1 串 的 顺序 存储 方式 1 
在 串 尾 存储 一 个 不 会 在 串 中 出 现 的 特殊 字符 作为 串 的 终止 符 ， 以 此 表示 串 的 结尾 。 如 
图 4.2 所 示 ， 它 是 用 \0' 来 表示 串 的 结束 。 这 种 存储 方法 不 能 直接 得 到 串 的 长 度 ， 它 使 用 判 
断 当前 字符 是 否 是 \0 来 确定 串 是 否 结束 ， 从 而 求 得 串 的 长 度 。 
char s[MAXSIZE] 


0123435678 9 10… MAXSIZE-1 
a|ld|cl|dje|/S|g]Alils|&k]\0 





























4.2 串 的 顺序 存储 方式 2 
串 的 顺序 存储 结构 就 是 用 数组 存放 串 的 所 有 字符 ， 数 组 有 静态 数组 和 动态 数组 两 种 。 
1. 静态 数组 结构 
静态 数组 结构 也 称 为 定 长 顺序 结构 ， 其 数据 结构 类 型 定义 如 下 。 





游 
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it 








typedef struct{ 
char str[MAXSIZE]; 
int length; 
}String; 


2. 动态 数组 结构 
动态 数组 结构 也 称 堆 分 配 存储 结构 .为 了 实现 动态 存储 , 我 们 定义 动态 数组 的 结构 体 如 下 


typedef struct 
{ 
char * str; 


int maxLength; 


int length; A 
} DString; xz im 
其 定义 中 比 静 态 数组 结构 体 增加 了 一 个 指出 动态 数组 长 度 的 域 ， 为 每 次 动态 存储 空间 
MESA. DY es AL AA A 
4.2.2 串 的 链 式 存储 XS 
的 链 趟 存储 结构 与 线性 表 的 链 式 大 信和 档 类 似 ， 是 将 存储 区 分 成 许多 “ 结 点 ”每 个 
结 点 包含 一 个 存放 字符 的 域 和 一 个 存放 指向 下 一 个 结 点 的 指针 域 。 采 用 链 式 存储 结构 的 中 


称 为 链 串 。 由 于 串 的 特殊 性 一 一 每 个 元 素 只 含 一 个 字符 "因此 ， 每 个 结 点 可 以 存放 一 个 
p A ge i di 














YY” 图 4.3 多 字 入 直上 的 链 式 丰 信 结构 
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图 4.4 单字 符 结 点 串 的 链 式 存储 结构 
当 结 点 大 小 大 于 1( 如 结 点 大 小 等 于 4) 时 ， 链 串 的 最 后 一 个 结 点 的 各 个 数据 域 不 一 定 总 
能 全 被 字符 占 满 。 此 时 ， 应 在 这 些 未 占用 的 数据 域 里 补 上 不 属于 字符 集 的 特殊 符号 (如 “#” 
字符 )， 以 示 区 别 ， 如 图 4.3 中 的 最 后 一 个 结 点 所 示 。 
为 了 实现 链 串 的 基本 操作 ， 串 的 链 式 存储 结构 类 型 描述 如 下 。 
typedef struct node 
{ 




















char data; 
struct node *next; 
}LinkStrNode; 
typedef LinkStrNode * LinkString; // 链 式 串 的 指针 


为 了 便于 进行 串 的 操作 ， 当 以 链表 存储 串 值 时 ， 除 头 指针 外 还 可 附设 一 个 尾 指针 指示 
链表 中 的 最 后 一 个 结 点 , 并 给 出 当前 串 的 长 度 。 我 们 称 如 此 定义 的 串 存储 结构 为 块 链 结构 ， 


fp 




















数据 结构 (语言 的) C $) 


串 的 块 链 结构 类 型 可 描述 如 下 。 


#define SIZE 60 // 可 由 用 户 定义 的 块 大 小 
typedef struct ChunkNode 
{ 
char data[SIZE]; 
struct ChunkNode *next; 
}ChunkNode; 








typedef struct 

{ 
int curlen; // 块 链 串 的 当前 长 度 
ChunkNode *head, *tail; // 块 链 串 的 头 和 尾 指针 


} ChunkLinkStr 
typedef ChunkLinkStr * ChunkLinkString; nae 
在 链 式 存储 方式 中 ， ee 方 式 选 择 一 样 重要 ， 它 直接 影 
响 着 串 处 理 的 效率 。 在 各 种 的 串 的 处 理 系统 中 ， 往往 很 长 或 很 多 ， 例 如 ， 一 本 
书 的 几 百 万 个 字符 ， ERT 求 我 们 考虑 串 值 的 存储 密度 。 存 储 


密度 可 定义 为 ke 
占 的 存储 位 
人 me 


显然 ， 存 储 密度 小 (如 结 sgh. examen. 存储 占用 量 大 。 如 果 在 
串 处 理 过 程 中 需要 进行 内 、 外 存 交 找 ， 则 会 因为 内 外 作 过 多 而 影响 处 理 的 总 效率 。 
应 该 看 到 ， 申 的 字符 集 大 水 也 是 一 个 重要 因素 ee 
ENAIT rel. Fr 


NY 下 
Xv! 4.3*” 串 的 模式 匹配 


串 的 模式 匹配 即 子 串 定位 是 一 种 重要 的 串 的 运算 。 设 8 和 了 是 给 定 的 两 个 串 ， 在 主 串 
S 中 找到 等 于 子 串 了 的 过 程 称 为 模式 匹配 (其 中 了 称 为 模式 串 )， 如 果 在 8 中 找到 了 的 子 串 ， 
则 称 匹 配 成 功 ， 函 数 返 回 了 在 S 中 首次 出 现 的 存储 位 置 (或 序号 )， 否 则 匹配 失败 ， 返 回 -1。 

为 了 运算 方便 ， 设 字符 串 的 长 度 存放 在 0 号 单元 ， 串 值 从 1 号 单元 存放 ， 这 样 字符 序 
号 与 存储 位 置 一 致 。 本 节 主要 介绍 模式 匹配 的 简单 算法 和 一 种 改进 的 算法 KMP 算法 )。 
4.3.1 模式 匹配 的 简单 算法 


其 基本 思想 是 分 别 利 用 计数 指针 i 和 jj 指示 主 串 8S 和 模式 串 了 中 当前 正 待 比较 的 位 置 。 
首先 将 S[1] 和 7T1] 进 行 比较 ， 若 不 同 ， 则 将 S[2] 和 7T1] 进 行 比较 ，…… ， 直 到 Ss 中 的 某 一 
个 字符 STA 7TH 相 同 ， 再 将 它们 之 后 的 字符 进行 比较 ， 若 也 相同 ， 则 如 此 继续 向 下 比较 ， 
4S 的 某 一 个 字符 5[i] 与 的 字符 7D] 不 同时 ,， 则 S 返回 到 本 趟 开始 字符 的 下 一 个 字符 ， 即 
SH+] TRAR TT1]， 继 续 开始 下 一 趟 的 比较 ， 重 复 上 述 过 程 。 若 了 中 的 字符 全 部 比较 
完 ， 则 说 明 本 趟 匹配 成 功 ， 否 则 ， 匹 配 失败 。 
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设 主 串 S="ababcabcacbab"， 模 式 串 T="abcac"， 匹 配 过 程 如 图 4.5 所 示 。 
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图 4.5 模式 匹配 的 匹配 过 程 
其 算法 执行 步骤 如 下 。 
(1) 判断 匹配 位 置 是 否 到 串 的 末尾 。 
(2) 如 果 主 串 与 模式 串 对 应 字符 相等 ， 则 继续 匹配 下 一 字符 。 
(3) 否则 主 串 、 子 串 指针 回溯 则 重新 开始 下 一 次 匹配 数据 元 素 。 
(4) 判断 是 否 匹 配 成 功 。 
前 面 我 们 已 经 用 串 的 其 他 操作 实现 了 模式 匹配 的 算法 Index0。 现 在 考虑 不 用 串 的 其 他 
操作 ， 而 是 用 基本 的 数组 来 实现 同样 的 算法 。 注 意 ， 这 里 假设 主 串 8$ 和 要 匹配 的 子 串 了 的 
长 度 都 存在 S[0] 和 7[0] 中 ， 对 应 的 代码 见 算法 4.1。 其 中 i 用 于 主 串 5 中 当前 位 置 下 标 值 ， 
若 pos 不 为 1， 则 从 pos 位 置 开始 匹配 , j 是 用 于 子 串 了 中 当前 位 置 下 标 值 ， 当 i 小 于 5 的 


长 度 并 且 j 小 于 7 的 长 度 时 ,循环 继续 。 
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数据 结构 ( EK 《 7 ) 


算法 4.1 模式 匹配 的 简单 算法 。 


int Index(char S[], char T[], int pos) { 
int i = pos; 
int j = 1; 
while (i <= S[0] && j <= T[0]) 110 号 单元 存放 串 的 长 度 





df Spi] == T[3]] 
{ 
+i; 
ttj; 
} 
else 


{ 


i = i-j+2; //i 退回 到 Kaman- 
elie //3 38 T 的 首位 
} 
an 
EE ai a ara 
return i-T[0]; = x, 
else 
return 0; i 
: > 


面 分 析 tytn Se iao S KEX n, rae Xo m。 匹 配 成 功 的 情况 下 考虑 
id ave 

(D 人 对 字符 比较 时 。 

例如 ，S="aaaaabc"w T="be", EPL 发 生 在 S 四 处 ， 则 字符 比较 次 数 在 前 面 六 1 趟 
aS i 趟 成 功 的 匹配 共 比 较 了 闫 次， 所 以 总 共 比 较 了 天 1+m 次 ， 所 有 匹 
配 成 功 的 可 能 n-mH 种 ， 设 从 5 四 开始 与 串 匹 配 成 功 的 概率 为 p;， 在 等 概率 情况 下 
PF1/(n-m+1)， 因 此 最 好 情况 下 平均 比较 的 次 数 是 

= p X(i- 1+m)= 5, x1 m=" (4.2) 


即 最 好 的 情况 下 的 时 间 复 杂 度 是 O(nt+m)。 
(2) 在 最 坏 的 情况 下 ， 每 趟 不 成 功 的 匹配 都 发 生 在 了 的 最 后 一 个 字符 。 
例如 ， 当 S="aaaaaaaaaabc"，T="aaab" 时 ， 设 匹配 成 功 发 生 在 Spek, MUZE RUT i-1 趟 



























































匹配 中 共 比 较 了 (=DXm 次 , 第 i 趟 成 功 的 匹配 共 比 较 了 m 次 ， 所 以 共 比 较 了 iXm ik, A 
此 最 坏 情况 下 平均 比较 次 数 是 
mel P met k mX(n-m+2) 
aries a E 5 (4.3) 
即 最 坏 情 况 下 的 时 间 复 杂 度 是 O(nxm) 。 在 4.3.2 节 ， 我 们 将 介绍 另 一 种 较 好 的 模式 匹 
当 模 式 串 为 "00000001"， 而 主 串 为 "00000000000000000000000000000000000000000 
00000000000" 时 ， 由 于 模式 中 前 7 个 字符 均 为 “0”， 主 串 中 前 52 个 字符 也 均 为 “0”， 每 趟 





2) © 


© = PSS 
比较 都 在 模式 的 最 后 一 个 字符 出 现 不 等 时 ， 将 指针 回溯 六 6 的 位 置 上 ， 并 从 模式 的 第 一 个 | 
字符 开始 重新 比较 ， 整 个 匹配 过 程 中 指针 i 需要 回溯 45 次 ， 则 while 循环 次 数 为 
46*8(index*m)。 可 见 ， 算 法 4.1 在 最 坏 的 情况 下 的 时 间 复 杂 度 为 O(nXm) 。 这 种 情况 在 只 
有 0、1 两 个 字符 的 文本 串 处 理 中 经 常 出 现 。01 串 可 以 用 在 许多 应 用 之 中 ， 比 如 一 些 计算 
机 的 图 形 显示 就 是 用 画面 表示 的 一 个 01 串 , 一 页 书 就 是 一 个 几 百 万 个 0 和 1 组 成 的 串 。 在 
二 进位 计算 机 上 实际 处 理 的 都 是 01 串 ， 一 个 字符 的 ASCII 码 也 可 以 看 作 八 个 二 进位 的 01 
串 ， 而 汉字 存储 在 计算 机 中 处 理 时 也 是 作为 一 个 01 串 和 其 他 的 字符 串 一 样 看 待 的 。 因 此 ， 
我 们 有 必要 介绍 一 种 改进 的 模式 匹配 算法 。 


4.3.2 KMP 算法 





























这 种 算法 是 由 D. E. Knuth 4 V. R. Pratt 和 J. H. Morris 同时 发 ， 因 此 人 们 称 它 为 克 
努 特 -英里 斯 - 普 拉 特 操作 (简称 KMP 算法 )。 I nt ae 数量 级 上 完成 串 
的 模式 匹配 操作 。 其 改进 在 于 ， 每 当 一 趟 匹配 过 程 中 出 aE FAREA 
针 ， 而 是 利用 已 经 得 到 的 “部 分 匹配 ”的 结果 将 模式 沿 尽 可 能 远 的 一 段 距离 后 ， 
继续 进行 比较 。 下 面 先 从 具体 例子 看 起 。 SO - 
回顾 图 4.5 中 的 匹配 过 程 示例 ， 在 第 三 趟 前 匹 酝 中 ， 当 二 7、j=5 字符 比较 不 等 时 ， 又 从 
i4, j=l 重新 开始 比较 。 然 而 ， Sn » E i4 Ñij=l, i=5 Ñ j=l, i=6 Ñ j=l 这 三 
次 比较 都 不 必 进行 的 。 因 为 从 第 三 的 结果 就 可 得 出 ， 主 串 中 第 4 一 6 个 字符 必然 
ED ola OHAN 2-A PEN) )。 因 为 模式 中 的 第 二 个 字符 是 a， 因 此 它 无 需 再 和 这 
三 个 字符 进行 比较 ， 而 仅 需 将 模式 串 向 右 滑动 三 个 SR ME 二 7、 j=2 时 的 字符 比较 即 
可 。 同 理 ， 在 第 一 趋 匹配 中 出 现 字符 不 等 时 ， ie aAa peal gene 
行 3, j=l 时 的 字符 比较 。 由 此 ， men Uh, 指针 没有 回 湖 ， 如 图 4.6 所 示 。 
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abc 
ts 
{i — Jer 
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图 4.6 改进 算法 的 匹配 过 程 示例 
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当主 串 中 第 i 个 字符 与 模式 中 的 第 j 个 字符 “ 失 配 ”( 即 比较 不 相等 ) 时 ， 主 串 中 第 i 个 
字符 (i 指针 不 回溯 ) 应 与 模式 中 哪个 字符 比较 呢 ? 

假设 应 与 模式 中 第 KK 过) 个 字符 继续 比较 ， 则 模式 中 前 本 1 个 字符 的 子 串 必须 满足 下 
列 关系 





























"PiP Pe = SS (4.4) 
而 已 经 得 到 的 匹配 结果 是 
Paha. Pp = Siasi Sa (4.5) 
由 式 4.3 和 式 4.4 推 得 下 列 等 式 
"PPa Pra =P jia Pj Pa" (4.6) 


反之 ， 车 模式 串 中 存在 满足 式 (4.5) 的 两 个 子囊， 则 匹配 过 程 中 ， 主 串 中 第 ;个 字符 与 
模式 中 第 7 个 字符 比较 不 等 时 , 仅 需 将 模式 向 右 滑动 至 模式 中 第 大 个 字符 与 主 申 中 第 ;个 字 
符 对 齐 ， 此 时 ， a e ae 中 第 i 个 字符 之 前 长 度 
YA FR seas Sa ME, E ere SB k NEE SLB OS iM 
字符 比较 起 继续 进行 。 

车 令 next[ j]=k, MW next[ 门 表明 当前 模式 sas 个 字符 与 主 串 中 相应 字符 “ 失 配 ”时 ,在 
i 由 此 可 引出 模式 串 的 next 函数 的 定义 。 


0 INN 
next[ j]= Ma <j App. op “Pa? (4.6) 
Guina a 


DET BA onon ALM E x * 
678 


an Ht Yowabcac 
N next[j]| 01122312 


在 求 得 模式 的 next 函数 之 后 ， 匹 配 可 如 下 进行 。 

假设 以 指针 7 和 j 分 别 指示 主 串 和 模式 中 正 待 比较 的 字符 , 令 i 的 初 值 为 pos, j 的 初 值 
为 1。 若 在 匹配 过 程 中 si=p;， 则 i 和 j 分 别 增 1， 否则 ,i 不 变 ,而 j 退 到 next[] 的 位 置 再 比 
较 ， 若 相等 ， 则 指针 各 自 增 1， 否 则 j 再 退 到 下 一 个 next 值 的 位 置 ， 以 此 类 推 ， 直 到 下 列 
两 种 可 能 : 一 种 是 j 退 到 某 个 next 值 (next[next[…next[ 刀 …]]) 时 字符 比较 相等 ， 则 指针 各 自 
增 1， 继 续 进 行 匹 配 ， 另 一 种 是 j 退 到 值 为 零 ( 即 模式 的 第 一 个 字符 “ 失 配 ”)， 则 此 时 需 将 
模式 继续 向 右 滑动 一 个 位 置 ， 即 主 串 的 下 一 个 字符 si 起 和 模式 重新 开始 匹配 。 图 4.7 正 是 
上 述 匹 配 过 程 的 一 个 例子 。 

当 匹 配 过 程 中 产生 “ 失 配 ”时 ， 指 针 i 不 变 ， 指 针 j 退回 到 next[ 四 所 指示 的 位 置 上 重 
新 进行 比较 ， 当 指针 退 至 零 时 ， 指 针 i 和 指针 需 同时 增 1， 即 车 主 串 的 第 i 个 字符 和 模 
式 中 的 第 1 个 字符 不 等 , 则 应 从 主 串 的 第 寺 1 个 字符 起 重新 进行 匹配 。 对 应 KMP 的 实现 见 
算法 4.2， 其 中 i 用 于 主 串 $ 中 当前 位 置 下 标 值 ， 若 pos 不 为 1， 则 从 pos 位 置 开始 匹配 ; j 
于 子 串 了 中 当前 位 置 下 标 值 。 
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算法 4.2 模式 匹配 的 RMP 
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该 算法 返回 子 串 TEER 8 中 第 pos 个 字符 之 后 的 位 置 。 若 不 存在 ， 则 函数 返回 值 为 
0。 其 中 了 非 空 ，pos 应 该 在 [1，StrLength(5)] 之 间 。 

KMP 算法 是 在 已 知 模式 串 的 next 函数 值 的 基础 上 执行 的 ， 那 么 ， 如 何 求 得 模式 串 的 
next 函数 值 呢 ? next 数组 的 求解 方法 是 第 一 位 的 next 值 为 0， 第 二 位 的 next 值 为 1， 后 面 
求解 每 一 位 的 next 值 时 ， 根 据 前 一 位 进行 比较 。 首 先 将 前 一 位 与 其 next 值 对 应 的 内 容 进 行 
比较 ， 如 果 相 等 ， 则 该 位 的 next 值 就 是 前 一 位 的 next 值 加 1; 如 果 不 等 ， 则 向 前 继续 寻找 
next 值 对 应 的 内 容 来 与 前 一 位 进行 比较 ， 直 到 找到 某 个 位 上 内 容 的 next 值 对 应 的 内 容 与 前 
一 位 相等 为 止 ， 则 这 个 位 对 应 的 值 加 1 即 为 需求 的 next 值 ， 如 果 找 到 第 一 位 仍然 没有 找到 
与 前 一 位 相等 的 内 容 ， 那 么 需求 位 上 的 next 值 即 为 1。 按 上 述 模式 串 的 next 函数 值 


了 12345678 
模式 申 abaabcac 
next[j]| 01122312 7; R 


来 对 其 具体 运算 的 过 程 表述 如 下 。 aw. 

(1) 前 两 位 必定 为 0 和 1。 

(2) 计算 第 三 位 的 时 候 ， 要 根据 第 二 位 b 的 mn zaam Yor, 若 为 1， 则 把 b 和 1 对 应 的 a 
进行 比较 : 若 不 同 ， 则 第 三 三 位 4 的 mext 的 全 为 为 一 直 比 较 到 最 前 一 位 ， 都 没有 发 生 
比较 相同 的 现象 。 

G 计算 第 四 位 的 时 候 ， 要 根据 第 衬 簿 的 next 值 决定 ， 若 为 1， 则 把 a 和 1 对 应 的 a 
进行 比较 ， 若 相同 ， 则 第 四 位 a 的 ext 的 值 为 第 三 位 aioe LE 1， 即 为 2， 因 为 在 
第 三 位 实现 了 其 next 值 对 应 的 值 与 第 三 位 的 值 相同 .到 

(4) 计算 第 五 位 的 时 候 ， 要 根据 第 四 位 a 的 next 也 定 ， 若 为 2， 则 把 a 和 2 对 应 的 b 
进行 比较 ， 若 不 同 ， 则 再 将 对 应 的 next 值 1 对 应 的 与 第 四 位 的 a 进行 比较 ， 若 相同 ， 
则 第 五 位 的 next / 位 b 的 next thie 为 2。 因为 在 第 二 位 实现 了 其 next 值 对 应 
的 值 与 第 四 位 的 值 相同 。 

(5) 计算 第 六 位 的 时 候 ， 要 根据 第 五 位 b 的 next 值 决定 ， 若 为 2， 则 把 b 和 2 对 应 的 b 
进行 比较 ， 若 相同 ， 则 第 六 位 c 的 next 值 为 第 五 位 b 的 next 值 加 1， 即 为 3， 因 为 在 第 五 
位 实现 了 其 next 值 对 应 的 值 与 第 五 位 相同 。 
(6) 计算 第 七 位 的 时 候 ， 要 根据 第 六 位 e 的 next 值 决定 ， 若 为 3， 则 把 c 和 3 对 应 的 a 
进行 比较 ， 若 不 同 ， 则 再 把 第 3 位 a 的 next 值 1 对 应 的 a 与 第 六 位 c 比较 ， 若 仍然 不 同 
则 第 七 位 的 next 值 为 1。 

(7) 计算 第 八 位 的 时 候 ， 要 根据 第 七 位 a 的 next 值 决定 ， 若 为 1， 则 把 a 和 1 对 应 的 a 
进行 比较 ， 若 相同 ， 则 第 八 位 c 的 next 值 为 第 七 位 a 的 next 值 加 上 1， 即 为 2， 因 为 在 第 
七 位 实现 了 其 对 应 的 值 与 第 七 位 相同 。 

求 next 值 的 对 应 代码 见 算法 4.3。 

算法 4.3 ”模式 串 的 next 函数 


void GetNextValue (String T, int *next) { 





























































































































int i,j; 
i=1; 
J=0; 





注意 : 虽然 简单 模式 匹配 算法 的 时 间 复 杂 度 为 orgia 一 般 情况 下 ， 其 实际 的 

执行 时 间 近 似 于 O(ntm)。KMP 算法 仅 当 模式 与 主 \ 许多 “部 分 匹配 ”的 情况 下 

才 显 得 比 简单 算法 快 得 多 。4.3.3 节 介绍 wey’ 法 的 改进 。 
À 


4.3.3 KMP 模式 匹配 改进 算法 > xX 
f Pi 

前 面 定 义 的 next cra 例如 ， 当 模式 "aaa a b" 在 和 主 串 "aaab 
aaaab" 匹 配 时 ,， 若 i=4, j=4, W 由 mext[7] 的 指示 还 需 进行 i=4、 j=3, i=4、 j=2, 
i4, jl RSME. KERES 式 中 的 第 一 、 -党 字符 和 第 四 个 字符 都 相等 ， 
因此 不 需要 再 和 主 串 中 san EA mana ie 
47 i=5, j=l 时 的 字符 就 是 说 ， 若 按 上 述 定义 得 到 nextval[k] =k ， 而 模式 中 pap, 
即 此 时 的 net] AT nek] 相同 。 由 此 可 计算 heXi 椰 数 的 修正 值 nextval， 图 4.8 为 上 述 模 


式 串 的 next BREA nextval 函数 值 。 YS 
d 





next[]|0 1234 
nextvallj] |0 0 0 0 4 
图 4.8 模式 串 的 next 函数 值 和 nextval 函数 值 


改进 后 求 next 值 的 代码 见 算法 4.4， 其 中 7T0] 表 示 串 了 的 长 度 。 
算法 4.4 ”模式 匹配 的 KMP 改进 算法 





4.4 用 串 实现 对 字符 


下 面 将 用 前 面 所 学 的 知识 实现 对 以 下 字符 ， 要 求 将 下 面 字符 串 中 的 编号 、 姓 
名 、 人 性别、 电话 、 地 址 等 信息 解析 成 结构 能 包括 字符 串 的 初始 化 、 字 符 串 解析 


成 结构 体 、 结 构 体 输出 为 字符 串 等 。 
例如 ， 待 分 析 的 字符 mystr:// ddlsex=1|phone=40923456laddr=hangzhou 


程序 编写 如 下 。 > ~ 
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ve 独立 实践 


1. 请 编写 一 个 小 程序 把 下 面 URL 中 的 参数 部 分 (从 ? 字符 开始 ) 提 取 并 解析 出 来 。 

http://www.ppfilm.cn/player/pfadurl.d1l?type=default&uid=12345&pushid=1& partnerid=43256 
&fileid=123 &filetype=video 

2. 请 实现 系统 的 strcpy 函数 。 


Qs 





小 ” 结 





本 章 向 读者 介绍 了 串 类 型 的 定义 及 其 实现 方法 ， 并 重点 讨论 了 串 操作 中 最 常 
定位 操作 (又 称 模式 匹配 )” 的 两 个 算法 。 
串 有 两 个 显著 特点 : 其 一 ， 它 的 数据 元 素 都 是 字符 ， 因 此 它 的 存储 结构 和 线 
很 大 的 不 同 ， 如 多 数 情 况 下 ， 实 现 串 类 型 采用 的 是 “ 堆 分 配 ” 的 存储 结构 ， 而 当 用 链 和 
储 串 值 时 ， 结 点 中 数据 域 的 类 型 不 是 “字符 ”， 而 是 “ 串 ”， 这 种 块 链 结 构 通常 只 在 应 用 程 
序 中 使 用 ;其 二 ， 串 的 基本 操作 通常 以 “ 串 的 整体 ”作为 操作 对 象 ， 而 不 像 线 性 表 以 “ 数 
据 元 素 ”作为 操作 对 象 。 
“ 串 匹 配 ”的 简单 算法 的 思想 直截了当 ， 简 单 易 懂 ， 适 用 于 在 到 般 的 文档 编辑 中 应 
但 在 某 些 特殊 情况 下 ,如 只 有 0 和 1 两 种 字符 构成 的 文本 串 中 应 用 时 效率 很 低 。 KMP 算法 
是 它 的 一 种 改进 方法 , 其 特点 是 利用 匹配 过 程 中 已 经 得 到 的 主 串 和 寞 式 串 对 应 字符 之 间 “ 等 
3 a FRM 



















































































& 
一 、 选 择 题 ~ \ we 
Fi py 

1. Lie eee, E HRAB. 

2. 设 S= “C:\\document\\datastructure.doc”, M} Strlen(s)= ，“\” 的 字 
符 定位 的 位 置 为 LT 网 NG 

3. HAASE awe ， 称 两 串 相等 。 

4. 子 串 的 定位 运算 称 为 串 的 模式 匹配 ; PR 
称 为 模式 。 “ 

5. 设 目标 T="abecdedecbaa”, Hist P=“cdcc”， 则 第 次 匹配 成 功 。 


6. n 为 主 串 长 ，m 为 子 串 长 ， 则 串 的 古典 匹配 算法 最 坏 的 情况 下 需要 比较 字符 的 总 
次 数 为 。 


二 、 选 择 题 


1. 下 面 关 于 串 的 叙述 中 ， 不 正确 的 是 ( Je 
A. 串 是 字符 的 有 限 序列 








C. 模式 匹配 是 串 的 一 种 重要 运算 
D. 串 既 可 以 采用 顺序 存储 ， 又 可 以 采用 链 式 存储 
2. 若 串 SI="ABCDEFG",S2="9898",S3="##f",S4="012345", 执行 concat(replace(S1,substr 
(S1,length(S2),length(S3)),S3),substr(S4,index(S2,"8"),length(S2))) iF QHZ LA) 











A. ABC###G0123 B. ABCD###2345 
C. ABC##HHG2345 D. ABC#H#H2345 


数据 结构 (C 语言 版 ) ( ”) 


E. ABC###G1234 F. ABCD###1234 
G. ABC#H#HO1234 
3. RABI TE pH q, 其 中 4 是 p 的 子 串 , 求 g 在 p 中 首次 出 现 的 位 置 的 算法 称 为 (。 )。 

















A. RFE B. 连接 C. 模式 匹配 D. REK 
4. P S="abbdded"， 其 子 串 的 数目 是 ( )- 

A. 8 B. 28 Cc. 29 D. 7 
5. 串 的 长 度 是 指 ( ) 

A. 串 中 所 含 不 同 字母 的 个 数 B. 串 中 所 含 字符 的 个 数 

C， 串 中 所 含 不 同 字符 的 个 数 D. 串 中 所 含 非 空格 字符 的 个 数 
6， 串 "abcabcaaa" 的 next 数组 为 ( )。 





A. -100123410 B. -101212110 C. -100012341 is ~100123012 


7. 计算 上 题 中 字符 串 的 nextval 为 ( )o 
A. (-1,0,0,-1,0,0,-1,4,1) B. (-1,0,1 vie JU 
C. (-1,0,1,0,1,0,0,0,0) D. G 本 1.0 ,1,0,1,1) 
F 
三 、 简 答题 Cus 


g 


空 串 与 空格 串 有 何 区 别 ? »> xS 


， 串 是 一 种 特殊 的 线性 表 ， 其 什么 地 方 ? 
+ RRR EAR IBZ? z 
。 TERRIER UEAN 


XK 
+ RATA, Hone wenn 
、 应 用 是 ve SY 


1. CR: Se "(xtz)*y". Coins 求 子 串 和 置换 等 基本 运算 ， 将 s 转化 
为 1。 
2 BME Sl 和 S2 的 长 度 分 别 为 m 和 n。 求 这 两 个 字符 串 最 大 共同 子 串 算法 的 时 
间 复 杂 度 为 Tlm,n)。 估 算 最 优 的 T(m,n)， 并 简要 说 明理 由 。 
3. 函数 void insert(char*s,char*t,int pos) 将 字符 串 1 插入 到 字符 串 s 中 , 插入 位 置 为 pos。 
请 用 C 语言 实现 该 函数 。 假 设 分 配给 字符 串 s 的 空间 足够 让 字符 串 上 插入 (说 明 : 不 得 使 
任何 库 函 数 )。 
4，S-"S192…Sn" 是 一 个 长 为 Y 的 字符 串 ， 存 放 在 一 个 数组 中 ， 编 写 程序 将 8 进行 如 
修改 之 后 输出 。 
(1) 将 8 的 所 有 第 偶数 个 字符 按照 其 原来 的 下 标 从 大 到 小 的 次 序 放 在 S 的 后 半 部 分 。 
(2) 将 8 的 所 有 第 奇数 个 字符 按照 其 原来 的 下 标 从 小 到 大 的 次 序 放 在 S 的 前 半 部 分 。 
例如 ，5S="ABCDEFGHIJKL"， 则 修改 后 的 S="ACEGIKLJHFDB". 


二 








wm 上 wm 一 

































































多 维 数 组 


= 
向 外 ”问题 描述 
地 雷 小 游戏 





二 维 数组 来 记录 每 一 


在 程序 开发 中 ， 经 常 要 用 到 连续 的 数据 ， 如 地 雷 小 游戏 中 用 一 个 


个 地 雷 的 数据 ， 
地 雷 小 游戏 的 规则 : 根据 输入 的 信息 (输入 数组 的 脚 标 如 3，2)， 执 行 相应 的 挖 雷 功能 ， 


并 根据 执行 结果 给 出 相应 的 提示 及 正确 率 。 
程序 界面 设计 图 如 图 5.1 所 示 。 





图 5.1 地 雷 小 游戏 程序 界面 设计 图 


5.1 数 组 





表 、 栈 、 队 列 和 串 都 是 线性 的 数据 结构 ， 它 们 具有 相似 的 逻辑 特征 ， 即 : 每 个 数 
至 多 有 一 个 直接 前 趋 和 直接 后 继 。 而 下 面 要 介绍 的 多 维 数组 是 一 种 复 条 的 非 线性 结 
-个 数据 元 素 可 能 有 多 个 直接 前 趋 和 多 个 直接 后 继 。 






据 元 素 介绍 
构 。 它 们 的 逻辑 特征 是 : 





数据 结构 (C 语言 版 ) C ”) 
5.1.1 数组 的 概念 
1, 数组 的 定义 


数组 (Array) 是 在 程序 设计 中 ， 为 了 处 理 方便 ， 把 具有 相同 类 型 的 若干 数据 元 素 ao 
ql，"…，qis “…，4anml 按 有 序 的 形式 组 织 起 来 的 一 种 形式 ， 其 中 n 是 数组 的 长 度 。 这 些 按 序 
排列 的 同类 数据 元 素 的 集合 称 为 数组 。 
































2. 数组 的 分 类 
根据 数组 中 数据 元 素 a; 的 组 织 形式 不 同 ， 可 以 将 数组 分 为 一 维 数 组 、 二 维 数组 及 多 维 
(n 维 ) 数 组 。 
其 中 : 
tt re a 
元 素 除了 值 以 外 还 有 一 个 约定 元 素 位 置 的 下 标 。 etx 
(2) 二 维 数组 4[m][n]， 由 mXn 个 元 素 组 成 ， 元 素 fa 则 的 排列 ， 每 个 元 素 由 值 
和 两 个 能 约定 元 素 位 置 的 下 标 组 成 , 假设 4 是 一 个 7 eh 
形式 如 图 5.2 所 示 。 X- 
Aw x3 ad. 1 
a ay Ant 
| NOE 
vty = 7 Oe 
mr nna Oy x) 


A 3 加 52 m 行 n PEIA 


eee 2 a 个 数据 元 素 都 是 相 型 的 一 维 数组 ， 也 可 以 把 二 维 数组 看 作 
由 m 个 行 向 量 组 成 的 向 量 ， 也 可 以 看 作 由 汉 个 列 向 量 组 成 的 向 量 。 其 中 ， 每 个 数据 元 素 a 
可 以 看 作 一 个 列 向 量 形式 的 线性 表 ， 

a= (qos ) 0<j<n-1 
或 者 一 个 行 向 量 形式 的 线性 表 

a= (lo aps Gna) 0<i<m-1 








此 可 见 二 维 数组 就 是 一 个 具有 m 个 或 n 个 元 素 的 特殊 线性 表 。 并 且 , 每 个 元 素 ay( 除 
边界 外 ) 有 两 个 直接 前 趋 和 两 个 直接 后 继 , 即行 向 量 的 直接 前 趋 a,，, 和 直接 后 继 a, |,» STA) 
量 的 直接 前 趋 a,, MABE HE aa, o 

G) 多 维 数 组 即 n 维 数组 是 “数据 元 素 为 n-1 维 数组 ”的 线性 表 ， 每 个 元 素 均 属于 n 
个 向 量 ， 每 个 元 素 最 多 可 以 及 个 直接 前 趋 入 个 直接 后 继 。 


5.1.2 ”数组 的 存储 结构 和 实现 


根据 数组 的 定义 可 知 ， 数 组 一 旦 被 定义 ， 其 维 数 和 存储 空间 将 不 再 发 生变 化 ， 因 此 ， 
一 般 不 对 数组 进行 插入 和 删除 操作 ， 而 一 般 只 对 其 进行 取 值 和 更 新 操作 。 
对 于 数组 的 基本 运算 ， 常 见 的 有 以 下 几 种 。 



































D 
l ih 多 维 数 组 = 
© = j ~N 


(1) 初始 化 mitArray(&A，m): 若 维 数 n 和 各 维 长 度 合 法 ， 则 构造 相应 的 数组 4。 
(2) 销毁 DestroyArray(&A): 销毁 数组 。 
(3) 取 节点 GetElem(A，i: 当 数 组 4 已 存在 时 ， 若 各 个 下 标 不 超 界 ， 则 结果 返回 4 中 
第 i 个 数据 元 素 的 值 ， 否 则 返回 FALSE. 
(4) 赋值 Assign(&A，i，e): 车 下 标 不 超 界 ， 则 将 e 的 值 赋 给 所 指定 的 A 的 元 素 。 
并 非 任何 时 候 都 需要 同时 执行 以 上 运算 。 首 先 ， 不 同 问题 中 的 数组 所 需要 执行 的 运算 
可 能 不 同 ， 其次， 不 可 能 也 没有 必要 给 出 一 组 合适 各 种 需要 的 运算 ， 可 以 用 基本 运算 的 组 
合 来 实现 。 
数组 中 的 元 素 关系 是 线性 关系 ， 元 素 之 间 的 位 置 关系 是 有 规律 的 ， 并 且 数 组 一 般 不 进 
行 插入 或 删除 操作 ， 所 以 ， 采 用 顺序 存储 结构 存储 数组 比较 合适 。 但 是 计算 机 的 内 存 空间 
是 一 维 的 ， 因 此 用 一 组 连续 的 存储 空间 来 表示 多 维 数组 ， 就 必须 按 某 种 次 序 将 数组 元 素 排 
成 一 个 线性 序列 ， 然 后 将 这 个 线性 序列 顺序 存放 在 内 存 中 。 - 
一 维 数组 的 存储 方式 : 假设 用 一 组 连续 的 存储 单元 存 ee 并 且 数 组 的 第 
一 个 元 素 ao 的 存储 地 址 为 LOC(a,) ， 每 个 元 素 占用 c A WAI TCE a; 的 存储 地 址 
LOC(a,) 为 






































LOC(a,)= ee RA 
—— . 

1， 行 优先 顺序 存储 

wnat i 同一 行 根据 列 递增 的 次 


序 访问 数组 元 素 ， 访 问 完 第 有 元 素 之 后 it1 行 的 所 有 元 素 。 以 图 5.2 的 
二 维 数组 为 例 ， 按 行 优 Pike 


aor Aol Ay? An? Aot Ayr"? Fen MENS Amao? Ama Aniya 
Java, C4 E AAAA >; e AN 
2. 列 优先 顺序 存储 


将 数组 元 素 按 列 向 量 排列 ， 根 据 列 递增 的 次 序 访问 数组 元 素 ， 同 一 列 根据 行 递增 的 次 
序 访问 数组 元 素 ， 访 问 完 第 7 列 的 所 有 元 素 之 后 ， 再 访问 第 .+1 列 的 所 有 元 素 。 以 图 5.2 的 
二 维 数组 为 例 ， 按 列 优先 顺序 存储 的 线性 序列 为 

aw s Aor Brox s Amao Gory Ary s Amap US Oi harr 4, 

在 FORTRAN 语言 中 ， 数 组 就 是 按 列 优先 顺序 存储 的 。 

根据 数组 的 特性 可 知 ， 数 组 的 维 数 及 各 维 的 长 度 被 指定 后 ， 操 作 系统 会 为 其 分 配 一 片 
连续 的 存储 空间 ， 并 按照 上 述 两 种 方式 中 的 一 种 进行 存储 (具体 由 设计 语言 决定 )。 因 此 若 
给 出 一 组 下 标 便 可 求 得 相应 数组 元 素 的 存储 位 置 。 

例如 ， 如 图 5.2 所 示 的 二 维 数组 按 “ 行 优先 顺序 存储 ”进行 存储 ， 假 设 每 个 元 素 占 L 
个 存储 单元 ， 则 数组 中 的 任意 元 素 a 的 存储 地 址 计算 函数 为 : 

LOC(a, =LOC(an)+[n Xi+j]X L 
其 中 ，LOC(aoo) 为 数组 的 首 地 址 ， 也 称 为 基地 址 或 基 址 。 
若 数组 按 “ 列 优先 顺序 存储 ”进行 存储 ， 则 数组 中 的 任意 元 素 a, 的 存储 地 址 计算 函 


m-1,n-1 
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oii ree cree 


BA: 
LOC(a,)=LOC(a,.)+[m x 让 

根据 上 述 行 序 优先 存储 公式 ， 可 以 推广 得 到 n 维 数组 40…c 0 …e, 一 1,……， 

0.…6c,-1] 的 存储 公式 ,其 中 ci 是 第 i 维 的 长 度 ， 因 此 ， 对 于 任意 的 qj 的 地 址 计算 函数 为 : 
LOC(ajjs.. = LOC(goo .oj+(c X0, X hte XG, X jate, X jra tj L 

n 维 数组 的 地 址 计算 公式 又 称 为 n 维 数组 的 影像 函数 。 从 该 函数 可 以 得 出 ， 数 组 元 素 
的 存储 位 置 是 其 下 标的 线性 函数 ， 即 给 定 相应 的 下 标 值 ， 计 算 元 素 地 址 的 时 间 复 杂 度 为 
0O(1)， 所 以 数组 是 一 种 随机 存储 结构 。 


5.1.3 ”用 二 维 数组 解决 地 雷 小 游戏 的 问题 
(1) 定义 地 雷 小 游戏 中 数据 元 素 的 类 型 。 A 





(2) 编写 程序 实现 地 雷 小 游戏 
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na 
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es 


vè 独立 实践 


请 把 实例 中 的 每 一 块 周边 的 雷 数 求 出 ， 并 赋值 到 对 应 块 的 结构 体 中 。 


Qs 





5.2 ”和 矩阵 的 压缩 存储 


AA ampt 
查询 城市 间距 离 的 问题 


对 于 浙江 省 的 任意 六 个 城市 杭州 (hz), 温州 (wz), 舟山 (zs), 台州 (tz), 嘉兴 (jx) 和 人 金华 (jh)。 
如 果 将 这 六 个 城市 从 1 一 6 进行 编号 ， 则 任意 两 个 城市 之 间 的 距离 可 以 用 一 个 6x 6 的 矩阵 
RAT. HEE iTi i IARAA iNT, distance (i, 站 代表 城市 i 和 城市 j 之 间 的 距 
离 。 图 5.3 给 出 了 相应 的 矩阵 。 由 于 对 于 所 有 的 和 j 而 言 ， 有 distance (i, /= distance (j, 
i), PRVATKFEME RAS Rt ARSE. 





hz 





Y, W53 amanenn > 

AIRTEL BOR ER RR ERATA: EER 
的 名 称 后 ， 输 出 城市 间 的 距离 值 ; 

ee a ee ee ae 
AL, EMEA TENRARZ F, WOITE BENE, AIMLESS. 18 
是 当 和 矩阵 中 有 很 多 零 元 素 或 部 分 非 零 元 素 具 有 某 种 分 布 规律 时 ， 称 这 种 矩阵 为 特殊 矩阵 ， 对 
于 特殊 矩阵 往往 要 进行 压缩 存储 ， 以 便 节 省 存储 空间 。 所 谓 压缩 存储 即 多 个 值 相 同 的 元 素 只 
分 配 一 个 存储 空间 ， 不 存储 零 元 素 。 特 殊 矩 阵 主要 有 对 称 徐 阵 、 三 角 矩 阵 、 对 角 矩 阵 等 。 


5.2.1 ”特殊 矩阵 的 逻辑 结构 


1. st ARAB RE 
假如 4 是 一 个 BR, CR AL BE: 
0<i jn-l 
则 称 4 为 n 阶 对 称 和 矩阵 。 图 5.4 便 是 一 个 4 阶 对 称 和 矩阵 。 
2460 
4195 
6947 
04S 710: 


图 5.4 4 阶 对 称 和 矩阵 
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-一 一 


对 称 和 矩阵 中 的 元 素 关 于 主 对 角 线 对 称 ， 故 只 需要 为 每 一 对 对 称 的 元 素 分 配 一 个 存储 空 
间 ， 对 于 阶 和 矩阵 中 的 避 个 元 素 只 需要 n(n+1)/2 个 存储 单元 ， 这 样 能 节约 近 一 半 的 存储 空 
间 。 对 于 n 阶 甜 阵 ， 我 们 按 “ 行 优先 顺序 存储 ”其 主 对 角 线 (包括 对 角 线 ) 以 下 的 元 素 ， 基 
存放 形式 如 图 5.5 所 示 。 

















es yo me 


图 5.5 了 ) 阶 对 称 矩 阵 的 压缩 存储 
在 这 个 下 三 角 和 矩阵 中 ， 第 ; 行 (0 入 ;入 ”ID AA H 个 元 素 ， 元 素 总 数 为 : 
a n(n+l) 


Zen- 


AE T 
意 元 素 ay 和 数组 元 素 AZERA: Z 


AN 0<jSiS<n-1 
LOC(a, = Ko 
LOC(ao) I) +i 0<i<j<n-l 
Xx、 
1a k 


= fh HEE YY > eh 


LERNAR SABERES e AORN HET 
元 素 为 常数 c REN n BEE. F= AIEEE IBD AIA EMER NAR o 
REH n WEEE, 如 .6 所 示 。 Ke 









N oo Qoi Ant P Goi c a c 
s ani Ant Ql at ğ 
An B= 
c c c Anini Geni Anni * Anann 
(a) b= fa HERE (b) FZE RE 
5.6 =E 


三 角 矩 阵 的 压缩 存储 与 对 称 矩 阵 基本 一 样 ， 只 是 除了 存储 其 上 三 角 或 下 三 角 的 元 素 之 
外 , 还 要 加 一 个 存储 常数 c 的 存储 空间 。 因此 ， = TRS tsa ACD a] 
中 ，c 存放 在 向 量 的 最 后 一 个 存储 单元 中 。 
BE sakil ay 的 对 应 关系 式 如 下 。 
(1) 上 三 角 和 矩阵 的 sa[ 操 和 ay 的 对 应 关系 : 
LOC(a,)= LOC(ay9)+ ZED y 

















0<j<i<n-1 


© -一 


(2) 下 三 角 和 矩阵 的 sak] aj 的 对 应 关系 是 : 
LOC(a,)=LOCK ey )+ Fj 0<isyenri 


3. TAHERE 
HAEREA SATE 7G HE PE OLE A PK a, BRT ER 
角 线 上 和 主 对 角 线 相 邻 两 侧 的 若干 条 对 角 线 上 元 素 之 外 ， 所 有 其 他 的 元 素 均 为 零 。 常 见 的 
对 角 和 矩阵 有 三 对 角 和 矩阵、 五 对 角 和 矩阵 、 七 对 角 和 矩阵 等 。 图 5.7 就 是 一 个 三 对 角 和 矩阵 。 
aw aor 
aw ay ao 0 


an an | 


0 0 ani > 
= = S 
图 57 as 


5.2.2 “用 特殊 矩阵 解决 查询 城市 间距 离 的 问 是 “ei 


该 运 算 可 用 如 下 形式 算法 描述 。 ON 











ie azan T gy 


查找 离 给 定 城市 距离 最 近 的 城市 。 


5.3 Fa Ht x6 0 


5.3.1 iE AE ty 
Pie EE TR HE (A pn) AES TCH AY (aE EF EPR HY BU s=m Xn )， 
且 非 零 元 素 分 布 无 规律 。5= 一 ” 为 矩阵 的 稀疏 因子 ,通常 5<0.05 HOHE BK a BRIE E 


mXn 


5.8 Bll Ay — 4 Fi it PE o 





5.3.2” 稀 玻 矩阵 的 压缩 存储 

根据 稀 疏 矩阵 的 定义 可 知 ， 稀 玻 矩阵 的 压缩 存储 会 失去 随机 存 取 功能 。 因 此 ， 对 于 稀 
朴 矩 阵 有 两 种 常用 的 存储 方法 : 三 元 组 表 和 十 字 链 表 。 

1. 三 元 组 表 

1) 三 元 组 

在 存储 稀 朴 矩阵 时 ， 为 了 节省 存储 单元 ， 压 缩 存储 方式 可 只 存储 非 零 元 素 。 但 由 于 非 
零 元 素 的 分 布 一 般 是 没有 规律 的 ， 因 此 ， 在 存储 非 零 元 素 的 同时 ， 还 必须 存储 适当 的 辅助 
信息 ， 才 能 迅速 确定 这 个 非 零 元 素 是 矩阵 中 的 哪 一 个 元 素 。 最 简单 的 方法 是 将 非 零 元 素 的 
值 和 它 所 在 的 行 号 、 列 号 作为 一 个 节点 存放 在 一 起 ， 于 是 矩阵 中 的 每 一 个 非 零 元 素 都 
个 三 元 组 (i, js ap) 唯一 确定 。 其 结构 如 下 。 


tiry sis ate JO 


column 


此 ， 图 5.8 ar AREY LA = ea 述 

(0; 0, 5), (0, 4, 3), (1, 3， aN 2,7), (3, 0, 4) 
SEAS, BENE MENRE, OEE AE AT BO. Jy TERNE, 
还 要 将 非 零 元 素 的 个 数 与 三 元 组 表 存 。 因 此 ， 有 如 下 的 类 型 说 明 。 


#define MAXSIZE 100 X> oer 
typedef struct 小 
K as 

me aa A 零 元 素 的 行 号 、 列 号 */ 
os Ky Ne 
Fir S 
-e ruct 


int m,n, r; /+ 稀疏 矩阵 的 行 数 、 列 数 及 非 零 元 素 的 个 数 */ 
TripleNode data[MAXSIZE+1]; /* 三 元 组 顺序 表 */ 














































































}TMatrix 

三 元 组 线性 表 可 以 采用 顺序 存储 结构 或 链 式 存储 结构 进行 存储 。 

2) 三 元 组 顺序 表 

若 将 稀疏 匹 阵 中 的 非 零 元 素 按 行 优先 (或 列 优先 ) 的 顺序 存放 在 一 个 由 三 元 组 组 成 的 数 
组 中 进行 存储 ， 则 得 到 一 个 节点 均 是 三 元 组 的 线性 表 ， 称 该 表 为 三 元 组 顺序 表 。 该 表 是 稀 
朴 矩 阵 的 一 种 顺序 存储 结构 。 图 5.6 所 示 的 稀疏 矩阵 的 三 元 组 表 实 现 如 图 5.9 所 示 。 

2. 十 字 链 表 法 

当 珑 阵 中 非 零 元 素 的 位 置 或 个 数 经 常 发 生变 化 (如 和 矩阵 进行 加 减法 等 运算 ) 时 ， 用 三 元 组 
顺序 表 来 存储 稀疏 矩阵 中 的 非 零 元 素 就 不 太 合适 了 。 此 时 ， 采 用 链表 做 存储 结构 更 为 恰当 。 

稀 玻 和 矩阵 的 链表 存储 方法 主要 有 三 种 : 单 链表 、 行 / 列 的 单 链表 和 十 字 链 表 。 下 面 仅 介 
绍 十 字 链 表 的 表示 方法 。 
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i j e 
0 0 5 
0 4 3 
1 3 2 
2 2 7 
3 0 4 


图 5.9 FER A 的 三 元 组 存储 
在 该 方法 中 ， 每 一 个 非 零 元 素 对 应 十 字 链 表 中 的 一 个 节点 。 节点 的 结构 如 图 5.10 
所 示 。 





o a 行 后 继 结 点 Co 
i | F; E rnext” a; cnext 
msio mer E oe 


其 中 , i j、e 分 别 指 非 零 元 素 e aS 中 所 对 应 的 行 号 为 i， 列 号 为 j。rnext 指示 
本 行 的 下 一 个 非 零 元 素 ，cnext 指 et 下 一 个 非 零 元 素 。 

行 指针 域 mext KERRE RE - 行 上 的 非 零 元 素 二 起 ， 列 指针 域 cnext 将 同一 
列 上 的 非 零 元 素 链接 在 一 起 2 TR 于 第 j 列 ,是 第 i 行 和 第 j 列 的 
交叉 点 ， 故 称 这 样 的 链表 为 十 字 链 表 。 为 了 运 增加 了 两 个 指针 数组 ， 分 别 用 来 存 
dae ad A 5.8 PIERE A 的 十 字 链 表 如 图 5.11 所 示 。 














图 5.11 图 5.8 的 稀疏 矩阵 A 的 十 字 链 表 
十 字 链 表 的 说 明 如 下 : 


typedef struct LNode 
{ 
Sie ra it 


DataType e; 

struct LNode *rnext, *cnext; 
}Link; 
Link *rhead [4],*chead[5]; 


小 ” 结 

通过 本 章 的 学 习 ， 读 者 熟悉 了 多 维 数组 和 特殊 矩阵 的 类 型 定义 及 其 在 C 语言 中 的 实现 

方法 。 数 组 作为 一 种 数据 类 型 ， 是 一 种 多 维 的 非 线 性 结构 ， 并 只 进行 存 取 或 修改 某 个 元 素 

的 值 ， 因 此 一 般 顺 序 存储 在 一 组 地 址 连续 的 存储 单元 中 ， 下 标 和 存储 地 址 有 一 定 的 对 应 关 

系 。 研 究 非 零 元 素 或 零 元 素 分 布 有 一 定 规律 的 特殊 矩阵 的 压缩 于 解决 我 们 现实 生活 
的 问题 有 比较 重要 的 意义 ， 如 可 用 于 图 像 压缩 方面 。 ON 


3 aò) 











mee ES 
1. 一 维 数组 的 逻辑 结 A 储 结构 是 ; 对 于 二 维 或 多 维 数 组 ， 分 
wie a 储 方式 进行 存储 


2， 对 于 维 数组 -4[mj[n]， ey A AIREAREN A 
BATEE ETOC, 则 X Huh 。 

3. 二 维 各 40I01201 采 用 列 序 为 主 帮 式 丰 每 个 元 素 占 1 个 存储 单元 ， 并 且 第 一 
个 元 素 的 存储 200， 则 4[6][12] 的 地 焉 是 

4. 有 一 个 10 阶 整 型 对 称 和 矩阵 A, 采用 压缩 存储 方式 (以 行 序 为 主 序 存储 , H 4[0][0]=1)， 
则 4[8][5] 的 地 址 是 

5， 设 矩阵 4 是 一 个 对 称 和 矩阵 ， 为 了 节约 存储 空间 ， 将 其 下 三 角 和 矩阵 按 行 序 存放 在 一 
维 数组 B[0，n(n+1)/2] 中 ， 对 下 三 角 部 分 中 的 元 素 ay(i> 让 而 言 ， 在 一 维 数组 B 中 下 标 上 的 
值 是 





6. 三 元 组 表 中 的 每 个 节点 对 应 于 稀疏 矩阵 的 一 个 非 零 元 素 ， 它 包含 三 个 数据 项 ， 分 别 
表示 该 元 素 的 、 和 
二 、 判 断 题 


1. 一 维 数组 和 线性 表 的 区 别 是 前 者 长 度 固定 ， 后 者 长 度 可 变 。 
2. 在 二 维 数组 中 ， 每 个 数组 元 素 同时 处 于 一 个 向 量 中 。 

3. 多 维 数 组 实际 上 是 由 一 维 数 组 实现 的 。 

4. 多 维 数组 的 数组 元 素 之 间 的 关系 是 线性 的 。 








一 一 一 一 
weve 





一 -一 


数据 结构 ( 语言 版 ) 6) 
_ “OQ 























5. 若 采 用 三 元 组 压缩 技术 存储 稀疏 答 阵 ， 只 要 把 每 个 元 素 的 行 下 标 和 列 下 标 互 换 ， 即 





可 完成 对 该 矩阵 的 转 置 运算 。 ( ) 
三 、 选 择 题 
1， 常 对 数组 进行 的 两 种 基本 操作 是 ( e 
A. 索引 与 修改 B. 新 建 与 删除 
C， 存 取 和 修改 数据 元 素 D. 查找 与 索引 


2. 在 二 维 数组 4 中 ， 每 个 元 素 的 长 度 为 3 个 字 节 ， 行 下 标 为 0~7， 列 下 标 为 0~9， 
从 首 地 址 sa 开始 连续 存放 在 存储 器 内 ， 该 数组 按 行 存放 时 ， 数 组 元 素 a[7][4 的 起 始 地 址 为 
( 
A. 1240 B. 1222 C. 1140 D. 1320 
Oe SARRATS DE E se 
A A RE A TEN a ). 
A. 33 B. 21 GC. 15 AND. 52 
人 Rn NEA, ORF MONEE, )， 
A. nXn B. nXn/2 $0 1)2 D. (n+1}/2 
eh 个 字 节 ) 组 成 的 串 ， 行 下 标 i 为 0~8， 
列 下 标 j 为 1 一 10， 则 存放 M 至 少 需要 (@) 个 字 闻 :，M 的 第 8 列 和 第 5 列 共 占 (@) 个 字 节 
BM TH RA, MUCH MSR 0 ALC NS) 





素 的 起 始 地 址 一 致 。 xX、 
@ A. 540 B. 520). \ C. 80 Dy 9K 
@ A. 240 . 108 > C. 60 D; 100 


© A. MJ] B. METIS] C. WII D. Mi3}[10} 


6. PEENE 讨 缩 存储 方法 有 (< 12)。 
A 和 三 维 数组 D B. 三 元 组 和 散 列 


C. 散 列 和 十 字 链 表 D. 三 元 组 和 十 字 链 表 
四 、 简 答题 
1， 按 行 优先 顺序 和 列 优先 顺序 列 出 四 维 数组 4[2][2][2][2] 所 有 元 素 在 内 存 中 的 存储 
次 序 。 
2. 现 有 稀疏 矩阵 4 如 下 所 示 ， 要 求 画 出 其 以 下 各 种 表示 法 。 
1005 
0350 
0007 
6000 


(1) 三 元 组 顺序 表 表 示 法 。 
(2) 十 字 链 表 表 示 法 。 


Ç wes 维 数组 
© = 
五 、 编 程 题 


1. 以 一 维 数组 作为 存储 结构 ， 实 现 线性 表 的 就 地 逆 置 , 即 在 原 表 的 存储 空间 内 将 线性 
Rlar a» az “> jy qn) 道 置 为 (a,， Qi? “°> a3» ax» Aj)o 

2. 已 知 一 个 nXn WHERE B 按 行 优先 存 于 一 个 一 维 数组 4[0…n(n-1)] 中 ， 试 给 出 一 个 
就 地 转 置 算法 ， 使 其 将 原 矩 阵 转 置 后 仍 存 于 数组 4 中 。 

3. 假设 稀疏 矩阵 4 和 B( 具 有 相同 的 大 小 mXn) 都 采用 三 元 组 表示 ， 编 写 一 个 函数 计 
算 C=4+B， 要 求 C 也 采用 三 元 组 表示 。 








树 


ÑA amit 
快速 搜索 磁盘 文件 中 记录 的 问题 


有 一 个 文件 包含 很 多 条 记录 ， 如 图 6.1(a) 所 示 ， AOR E 的 关键 字 ( 学 号 ) 
标识 该 条 记录 ,该 文件 随机 存储 在 磁盘 上 ， 为 了 方便 实现 在 磁盘 上 对 图 6.1(a) 中 的 记录 进行 
dH. MM, Hh. BAR, HR RAL ABS LAPT ALE 6.100), 

现 需要 实现 如 下 的 功能 

(1) 选择 一 种 数据 结 构 在 内 存 中 存放 案 引 ， 通过 该 数据 结构 能 高 效 地 插入 、 遍 历 和 
搜索 索引 表 ; E aa e pa T 


l Pa \ 
it ar 
| 1000 | 20120101 | : 
Foran | 1100 
[iee IY ee r 
isonet a na | 
| 计算 机 121 | | 
[aa |? 
| 计算 机 121 | | 





(a) 文件 存储 区 (b) 索引 表 
6.1 随机 存储 中 的 记录 
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树 形 结构 是 一 类 重要 的 非 线 性 结构 。 树 形 结构 是 节点 之 间 有 分 支 ， 并 具有 层次 关系 的 结 
构 ， 它 非常 类 似 于 自然 界 中 的 树 。 树 结构 在 客观 世界 中 是 大 量 存在 的 ， 如 家 谱 、 行 政 组 织 机 
构 都 可 用 树 形象 地 表示 。 树 在 计算 机 领域 中 也 有 着 广泛 的 应 用 ， 如 在 编译 程序 中 ， 用 树 来 表 
示 源 程序 语法 结构 ; 在 数据 库 系 统 中 ， 可 用 树 来 组 织 信息 。 本 章 重点 讨论 二 又 树 的 存储 表示 
及 其 各 种 运算 ， 并 研究 一 般 树 、 森 林 与 二 又 树 的 转换 关系 ， 最 后 介绍 树 的 应 用 实例 。 










































































1. 树 的 定义 

1) 树 的 定义 

树 (Tree) 是 nz 之 0) 个 节点 的 有 限 集合 T, n=0 的 树 称 为 空 树 ， 当 n>0 的 时 候 满足 如 下 
两 个 条 件 : 

(1) 有 且 仅 有 一 个 称 为 根 (Root) 的 节点 。 

(2) 其 余 的 节点 可 分 为 m(m 宕 0) 个 互 不 相交 的 有 限 集合 TI，7T5，…，7T,,， 其 中 每 个 集合 
又 是 一 棵 树 ， 并 称 其 为 根 节点 的 子 树 (Sub Tree)。 

在 树 的 树 形 图 表示 中 ,节点 通常 是 用 圆圈 表示 的 , 节点 的 名 称 一 般 是 写 在 圆圈 旁边 的 ， 
有 时 也 可 写 在 圆圈 内 ， 如 图 6.2(a) 所 示 。 



































T 





树 的 定义 是 一 个 递归 的 定义 ， 即 一 棵 树 是 由 若干 棵 子 树 构成 的 ， 而 子 树 又 可 由 若干 棵 
sag els 树 中 的 每 个 节点 都 是 该 树 中 某 一 ta 
如 











图 6.2 所 示 。 


见 的 树 的 表示 方法 有 图 示 法 、 集 合 表示 法 和 横向 凹 入 表示 























A 
B 
D 
H 
E 
3 C 
e F 
X S 
Ks $y 
Neu Soy secrete O BRIANA Ae 
入 图 6.2 树 的 表示 方法 


从 图 6.2 可 以 看 出 ， 树 的 表示 方法 中 图 示 法 最 直观 ， 该 方法 主要 用 来 描述 树 的 逻辑 
结构 ， 横 向 凹 入 法 主要 用 于 树 的 屏幕 显示 和 打印 输出 ， 本 书 主要 采用 图 示 法 来 表示 树 的 

2) 树 的 特点 

非 空 的 树 具有 下 面 的 特点 。 

(1) 有 且 仅 有 一 个 节点 没有 直接 前 趋 ， 称 它 为 根 节点 。 

(2) 有 一 个 或 多 个 节点 没有 直接 后 继 ， 称 它 为 终端 节点 ， 即 叶子 节点 ; 

G) 除开 始 节点 外 ， 树 中 其 他 任 一 节点 都 有 且 仅 有 一 个 直接 前 趋 ; 

(4) 除 终端 节点 外 ， 树 中 其 他 任 一 节点 都 有 一 个 或 多 个 直接 后 继 。 


2. 树 的 基本 术语 


下 面 以 图 6.2(a) 为 例 给 出 树 结构 中 常用 的 基本 术语 。 
(1) 节点 : 树 中 包含 的 一 个 数据 元 素 及 若干 指向 其 子 树 的 分 支 , 如 图 6.2(a) 中 的 4、B、 


a m 
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(2) 节点 的 度 : 一 个 节点 所 具有 的 子 树 的 个 数 ， 如 图 6.2(a) 中 的 4 节点 ， 其 度 为 2。 

(3) 树 的 度 : 树 中 度数 最 大 的 节点 的 度 ， 如 图 6.2(a) 所 示 的 树 ， 其 度 为 2。 

(4) 叶子 : 度 为 0 的 节点 即 为 叶子 节点 (又 称 终端 节点 )， 如 图 6.2(a) 中 的 E、F、G、 He 

(5) 非 终端 节点 : 也 称 内 部 节点 ， 是 指 除根 节点 外 ， 其 他 度 不 为 0 的 节点 ， 如 图 6.2(a) 
HE BY Cy De 

(6) 双亲 、 孩 子 节点 : 树 中 某 个 节点 的 子 树 的 根 称 为 该 节点 的 孩子 ， 相 应 地 ， 该 节点 
称 为 孩子 的 双亲 。 在 图 6.2(a) 中 ，B 的 双亲 为 4，B 的 孩子 为 D、E。 

(7) 兄弟 节点 : 同一 个 双亲 的 孩子 之 间 互 称 为 兄弟 ， 如 图 6.2(a) 中 的 B、C。 

(8) 祖先 : 从 根 到 该 节点 所 经 分 支 上 的 所 有 节点 ， 如 图 6.2(a) 中 矿 的 祖先 为 4、B、D。 

(9) 子孙 : 以 某 一 节点 为 根 的 子 树 中 的 任意 节点 都 称 为 该 节点 的 子孙 ， 如 图 6.2(a) 中 B 
的 子孙 为 D、E、H。 A 

(10) 节点 的 层 数 ， 从 根 开始 第 起 的 导数 。 根 节点 的 层 数 为 “| 站 人 节点 的 层 数 等 于 其 
双亲 节点 的 层 数 加 1。 在 图 62(a) 中 ，4 的 层 数 为 1，B、 CEH 2, D, E, Fy GWR 
数 为 3， 刀 的 层 数 为 4。 poe 

Laue yg A a 树 的 高 度 为 4 

(12) 无 序 树 、 有 序 树 : SPEEA TDR g) 看 作 从 左 到 右 有 顺序 的 ( 即 不 能 互 换 
Hy ERORI PRO D RONEN STRANA A 
的 树 都 是 有 序 树 。 A i 

(13) 森林 : mim SO) 的 集合 。 如 图 6.2(a) 所 示 ， 去 掉 4 节点 就 可 以 得 到 
PIRACY ILL B、C 为 根 节 丰 ) 构 成 的 森林 ， 因 此 ， 对 于 树 中 的 每 个 节点 而 言 ， 其 子 树 的 集 
See MMA RE BAAR ， 加 上 一 个 节点 作为 树 根 ， 森 林 
就 变 成 一 棵 树 。 A |) x \Y 

po BAZ 
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二 叉 树 是 一 个 非常 重要 的 树 形 结构 ， 一 般 的 树 也 能 简单 地 转换 为 二 叉 树 ， 由 于 二 又 树 
的 存储 结构 及 其 算法 都 比较 简单 ， 因 此 经 常 被 用 来 解决 实际 中 的 树 形 问题 ， 是 一 种 常用 的 
树 形 结构 。 
6.2.1 二 叉 树 的 定义 

1. 二 又 树 的 定义 

二 叉 树 (Binary Tree) 是 n(n 宇 0) 个 节点 所 构成 的 有 限 集合 ， 当 n=0 时 称 为 空 二 叉 树 ; 

当 n>0 时 由 一 个 根 节点 及 两 棵 互 不 相交 的 、 分 别称 为 左 子 树 和 右 子 树 的 子 二 叉 树 组 成 。 

2. 二 又 树 的 特点 

二 叉 树 中 的 子 树 具 有 左右 之 分 ， 并 且 每 个 节点 最 多 只 能 有 两 棵 子 树 。 所 以 二 又 树 的 度 
最 多 为 2。 并 且 在 二 叉 树 中 ， 即 使 是 一 个 孩子 也 有 左右 之 分 。 


Qe 













































































© — 
3. 二 又 树 的 五 种 基本 形态 
根据 二 叉 树 的 定义 ， i a hii 如 图 6.3 所 示 。 


0 odo 


(a) 空 二 叉 树 Pe 个 (c) 右 子 树 为 ”(d) 左 子 树 为 (e) 左 、 右 子 树 
叉 树 空 的 二 叉 树 。 空 的 二 叉 树 ” 均 非 空 的 二 叉 树 


图 6.3 二 叉 树 的 五 种 基本 形态 








6.2.2 二叉树 的 性 质 


下 面 给 出 二 叉 树 的 几 个 重要 性 质 。 > 

性 质 1 在 二 叉 树 第 i 层 上 最 多 有 2"' (i 宇 1) 个 节点 。 K 

证 明 : (数学 归纳 法 )。 

O SLY, RASAR, IEZ oT) EM. 

(2) 假设 对 所 有 的 js/ 二 1 命题 成 立 ， MEXR 多 有 2 个 节点 ,那么 可 以 证 明 ji 
时 命题 也 成 立 。 P K i 

(3) 根据 归纳 假设 ， 第 六 1 peni 个 节点 。 由 于 二 又 树 的 每 个 节点 至 多 有 两 棵 
子 树 ， 故 第 1 层 上 的 节点 数 ， 最 多 ; nar 层 上 的 最 大 节点 数 的 f fae, Bel 
最 大 节点 数 为 2X 257 =2'1 ,- 1K 
性 质 2 深度 为 的 三 叉 树 硅 多 有 vad 
证 明 : fs) HL = 最 多 为 : 

> YS yer Z% -1 

性 质 3 对 任意 一 棵 二 叉 树 ， 如 果 其 叶子 节点 的 个 数 为 m， 度 为 2 WARAS m 
则 no=n2t+1。 

证 明 : 假设 二 叉 树 中 节点 总 数 为 x， 度 为 1 的 节点 数 为 m WE: 
n=n +n +n, (6.1) 
又 因为 在 二 叉 树 中 度 为 1 的 节点 有 一 个 孩子 ， 度 为 2 的 节点 有 两 个 孩子 ， 但 树 中 只 有 根 


节点 不 是 任何 节点 的 孩子 , 并 且 叶 子 节点 没有 孩子 节点 , 故 二 又 树 中 的 节点 总 数 又 可 表示 为 : 
n=0Xn,+1Xn,+2Xn, +1 (6.2) 



































综述 所 述 可 得 : m=m +1. 

下 面 介 绍 两 种 特殊 情形 的 二 叉 树 : 满 二 叉 树 和 完全 二 叉 树 。 

满 二 叉 树 (Full Binary tree): 深度 为 k 且 有 2 -1 个 节点 的 二 叉 树 称 为 满 二 又 树 。 图 6.4 
是 一 个 深度 为 4 的 满 二 又 树 。 

满 二 又 树 的 特点 是 每 一 层 上 的 节点 数 都 达到 最 大 值 ， 即 对 给 定 的 高 度 k， 它 的 节点 数 
都 为 最 大 值 2* -1。 满 二 叉 树 中 的 每 个 分 支 节 点 均 有 两 棵 高 度 相 同 的 子 树 , 且 树 叶 都 在 最 下 
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图 6.4 满 二 叉 树 
完全 二 又 树 (Complete Binary Tree) 是 深度 为 k 的 ， 有 nn 个 节点 的 二 叉 树 ， 当 上 且 仅 当 其 每 一 
个 节点 都 与 深度 为 的 满 二 叉 树 中 的 编号 从 1~n 一 一 对 应 时 ， 该 树 为 完全 二 又 树 。 图 6.5 
是 一 个 深度 为 4 的 完全 二 叉 树 。 , 
K 





zA yh 
显然 满 二 re 叉 树 ， (ERS = 一 定 是 满 二 又 树 。 
my 叉 树 的 特点 如 下 : T 
(1) 叶子 节点 只 可 能 出 现在 第 上 层 或 对 1 层 上 。 
(2) 对 任 一 节点 , 车 其 右 分 支 下 的 子孙 的 最 大 层次 为 h， 则 其 左 分 支 下 的 子孙 的 最 大 层 
KA h EÈ h+1. 
此 ， 在 完全 二 叉 树 中 ， 若 某 个 节点 没有 左 孩 子 ， 则 它 一 定 没 有 右 孩 子 ， 即 该 节点 必 是 
叶子 节点 。 如 图 6.6 所 示 ， 节 点 已 没有 左 孩 子 而 有 右 孩 子 M， 所 以 它 不 是 一 棵 完全 二 又 树 。 

















图 6.6 非 完 全 二 叉 树 


O -一 - Bi 
性 质 4 具有 个 节点 的 完全 二 叉 树 的 深度 为 [log,n |+1。( 符 号 [x | 表示 不 大 于 x 的 最 | 
大 整数 ) 
证 明 : 设 所 求 完 全 二 又 树 的 深度 为 k， 根据 其 定义 和 性 质 2 所 知 
pi E | 
此 可 推出 ，2 外 三 n <2* 。 对 不 等 式 两 边 取 对 数 后 有 
k-1Slog,n<k 
因为 上 是 整数 ， 故 有 : k=|logsn |+1。 
性 质 5 一 棵 具有 n 个 节点 的 完全 二 叉 树 (其 深度 为 | log,n |+1)， 如 果 按 照 从 上 往 下 、 
从 左 至 右 的 顺序 对 二 叉 树 中 的 所 有 节点 从 1 开始 编号 ,， 则 对 于 任意 节点 iA SiS nyA 
(1) 若 去 1， 则 i 为 二 叉 树 的 根 节点 ， 无 双亲 ; 若 i>1， 则 i 的 双亲 节点 为 [ i/2 | 。 
(2) 车 2i>n， 则 节点 i 无 左 孩 子 (节点 i 为 叶子 节点 )， a 2 i 
(3) Ë 2i >n, WHA AH. AM i MAE iy 2i+1. 
例如 ， 在 图 6.5 Ht, TINE 4， 其 左 点 B 为 2=2， 右 孩子 节点 C 为 































2i+1=3. SĮ 
Xr 
623 二叉树 的 存储 结构 AX 
类 似 于 线性 表 ， aa 
1 顺序 存储 结 is x 


A Cae SH 储 是 将 二 又 树 的 所 有 节点 ， 按 
照 一 定 的 节点 顺序 ， ed erosion mr 为 了 能 反映 出 各 个 节点 之 间 的 
BARR, 必须 把 节 FE 成 一 个 适当 

对 于 具 Kei i 的 完全 二 又 树 ， ecw, 从 左 到 右 ， 给 所 有 节点 从 
1 开始 编号 ， 就 可 以 得 到 一 个 反映 整个 二 又 树 结构 的 线性 序列 ， 如 图 6.7(a) 所 示 。 在 完全 二 
又 树 中 对 于 任意 节点 的 编号 i, 根据 二 又 树 的 性 质 5 可 推 得 其 双亲 节点 、 左 右 孩 子 节点 、 匈 
弟 等 节点 的 编号 。 图 6.7(b) 所 示 为 图 6.7(a) 的 顺序 存储 结构 。 
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(a) 完全 一 又 树 (b) 完全 一 又 树 的 顺序 
存储 结构 


图 6.7 节点 编号 的 完全 二 叉 树 及 其 顺序 存储 结构 
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由 二 叉 树 的 性 质 可 知 ， 完 全 二 叉 树 和 满 二 叉 树 中 节点 的 层次 序列 完全 反映 了 节点 之 间 
为 逻 辑 关 系 。 而 顺序 存储 结构 依靠 数组 中 的 序号 位 置 准确 地 反映 了 节点 之 间 的 逻辑 关系 。 
此 顺序 存储 结构 能 够 存储 完全 二 叉 树 。 

显然 ， 利 用 顺序 存储 结构 存储 完全 二 又 树 ， 既 简单 又 节省 存储 空间 。 但 是 ， 对 于 一 般 
的 二 叉 树 采用 顺序 存储 时 ， 为 了 能 够 明确 地 表示 树 中 各 个 节点 之 间 的 逻辑 关系 ， 也 必须 按 
完全 二 又 树 的 结构 将 各 个 节点 存储 在 一 维 数组 的 相应 分 量 中 ， 图 6.8 所 示 为 非 完全 二 叉 
树 及 其 顺序 存储 结构 。 




































































SN 
SN (b) 一 般 一 又 树 的 顺序 存储 结构 


图 6.8 er 其 顺序 存储 结构 
图 6.8(b) 中 的 “0” 表 示 不 存在 此 i) 顺序 存储 方式 对 于 非 完全 二 二 叉 树 的 存储 造成 了 
存储 空间 的 浪费 。 Ea dat 有 的 且 只 有 大 个 节点 的 右 单 支 树 却 需要 
ELEWA AKENO AIEEE 又 树 ， 而 非 完全 二 又 树 更 适合 
使 用 链 式 存储 结构 y wy 
Vv 
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二 又 树 通常 采用 链 式 存储 结构 存储 二 又 树 中 的 节点 及 其 相互 之 间 的 关系 ， 根 据 二 叉 树 
的 定义 可 知 ， 链 表 中 的 每 个 节点 除了 存储 数据 元 素 外 ， 还 至 少 要 有 两 个 指针 域 分 别 指向 其 
左右 孩子 节点 ， 才 能 表示 二 叉 树 的 层次 关系 ， 比 较 常用 的 链 式 存储 结构 有 二 叉 链 表 、 三 叉 
链表 。 图 6.9(a) 所 示 为 二 又 链表 中 的 节点 结构 。 在 此 结构 中 对 于 任意 节点 而 言 ， 寻 找 其 左右 
孩子 节点 非常 方便 ， 但 是 寻找 其 双亲 节点 又 比较 困难 ， 需 要 从 根 指针 出 发 逐个 排查 。 所 以 ， 
在 具体 应 用 中 ， 如 果 经 常 要 在 二 叉 树 中 寻找 某 节点 的 双亲 ， 则 可 以 在 每 个 节点 上 再 加 一 个 
指向 其 双亲 的 指针 域 parent， 图 6.9(b) 所 示 即 为 三 叉 链表 中 的 节点 结构 。 

lchild | date | rchild Ichild | date | parent | rchild 















































(a) 一 叉 链表 的 结 点 结构 (b) 三 又 链表 的 结 点 结构 
图 6.9 二 叉 树 的 节点 及 其 存储 结构 


利用 以 上 两 种 节点 结构 所 得 到 的 二 又 树 的 存储 结构 即 为 二 又 链表 和 三 又 链表 。 
二 又 链表 是 二 又 树 的 最 常用 的 存储 结构 , 在 后 面 的 各 小 节 中 的 有 关 二 又 树 的 各 种 算法 ， 
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都 是 基于 这 种 存储 结构 的 。 下 面 给 出 二 叉 链表 中 节点 结构 在 C 语言 中 的 类 型 定义 。 


typedef struct BiTNode 
{ 








DataType data; // 节 点 的 数据 元 素 
struct BiTNode *lchild, *rchild; // 左 右 孩子 指针 
} BiTNode, *BiTree; 

二 叉 树 的 二 又 链表 中 的 所 有 节点 类 型 为 BiTNode， 链 表 的 头 指针 root 指向 二 又 树 的 根 
节点 , 图 6.10(a)、(b) 所 示 为 二 叉 树 及 其 二 又 链表 存储 结构 。 若 二 又 树 为 空 ， 则 root=NULL. 
车 节点 的 某 个 孩子 不 存在 ， 则 相应 的 指针 域 为 空 。 容 易 证 得 ,在 含有 nn 个 节点 的 二 叉 树 中 ， 
一 共有 2n 个 指针 域 , 其 中 只 有 n-1 个 用 来 指示 节点 的 左 、 右 孩子 ， 其 余 的 n 个 指针 域 为 
空 ， 那 么 利用 这 些 空 指针 域 存储 其 他 有 用 信息 ， 可 以 得 到 另外 一 种 称 之 为 线索 链表 的 存储 
结构 。 aS 
树 形 结构 的 存储 方法 有 好 几 种 ， 至 于 哪 种 方式 合适 \ 主要 根据 实际 问题 实际 操作 进行 
iH. 例如， 如果 需 要 频繁 地 坦 找 闻 点 的 双 末 ， 则 需要 采用 三 双 链 表 存 储 ， 如 图 6.10(e) 所 
示 为 图 6.10(a) 的 三 又 链表 存储 结构 。 N 厂 
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fà 
(b) 一 又 链表 存储 结构 (c) AER HBS 
二 叉 树 及 其 二 叉 链表 、 三 叉 链表 存储 结构 


6.3 二叉树 的 遍历 和 线索 化 


6.3.1 二叉树 的 遍历 
1. 遍历 二 又 树 的 定义 及 算法 描述 
二 叉 树 的 遍历 是 指 沿 某 条 搜索 路 径 访 问 二 叉 树 中 的 每 个 节点 ， 并 且 对 树 中 每 个 节点 仅 

















访问 一 次 。 对 节点 的 访问 可 以 是 输出 、 更 新 、 增 加 、 删 除 等 操作 。 由 前 面 章 节 可 知 ， 对 于 
一 个 线性 结构 的 遍历 很 容易 ， 只 需要 从 开始 节点 出 发 顺序 扫描 每 个 节点 即 可 。 由 于 二 又 树 
的 每 个 节点 可 以 有 两 个 孩子 节点 ， 因 此 ， 需 要 寻找 一 种 规律 来 访问 树 中 各 节点 。 

根据 二 又 树 的 定义 可 知 ， 一 棵 非 空 的 二 又 树 由 三 部 分 组 成 : 根 节 点 、 左 子 树 和 右 子 树 。 
若 分 别 用 D、L 和 R 表示 上 述 三 部 分 ， 则 对 于 一 棵 非 空 二 又 树 的 遍历 即 为 ; 访问 根 节点 ， 
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遍历 左 子 树 ， 遍 历 右 子 树 ， 则 有 DLR, LDR, LRD, DRL, RDL, RLD 六 种 次 序 的 遍历 方 
案 。 其 中 前 三 种 遍历 序列 与 后 三 种 遍历 序列 正好 相反 ， 前 三 种 按 先 左 后 右 的 次 序 遍 历 根 的 
两 棵 子 树 ， 后 三 种 则 按 先 右 后 左 的 次 序 遍 历 根 的 两 棵 子 树 ， 由 于 二 者 对 称 ， 在 算法 设计 上 
没有 本 质 区 别 ， 因 此 只 讨论 前 三 种 次 序 的 遍历 方案 。 

根据 前 三 种 遍历 方案 中 根 节 点 访问 的 顺序 ， 可 得 到 二 叉 树 的 三 种 遍历 次 序 : 先 根 遍 历 
(或 先 序 遍历 )、 中 根 遍 历 (或 中 序 遍 历 ) 及 后 根 遍 历 ( 或 后 序 遍 历 )。 

根据 二 叉 树 的 递归 定义 ， 可 得 二 叉 树 的 三 种 遍历 的 递归 算法 。 

1) 先 根 遍 历 二 叉 树 

若 二 义 树 为 空 则 遍历 操作 结束 ， 否 则 依次 进行 如 下 操作 :访问 根 节点 ， 先 根 遍历 左 子 
树 ， 先 根 遍 历 右 子 树 。 









































2) 中 根 遍 历 二 又 树 

若 二 叉 树 为 空 则 遍历 操作 结束 ， 否 则 依次 进行 如 下 操 Cetin, wae 
点 ， 中 根 遍历 右 子 树 。 AS 

3) 后 根 遍历 二 又 树 hat 

BNWT, MMAR IRE: MLAS EM, AGAN 
右 子 树 ， 访 问 根 节点 ; oO 

例 6.1 已 知 表达 式 atb*c-f/(d-e) 对 二 叉 树 如 图 6.11 所 示 ， 请 写 出 其 对 应 的 三 种 遍 
历次 序 。 实 现 该 运算 的 基本 思想 : 根 = Chita Xk 序列 中 根 节点 的 访问 次 序 可 得 ; 
先 根 遍历 序列 为 -taxbc/f-de。 中 根 遍历 序列 为 Cr 为 abc*+fde-/-。 

> ba 
A ) A y 
Pe 


6.11 ”表达 式 的 二 叉 树 
在 下 面 的 三 个 递归 算法 中 ， 二 叉 树 为 空 作为 递归 的 终止 条 件 ， 此 时 应 为 空 操作 。 根 节 
点 的 访问 操作 应 当 根据 具体 的 情况 而 定 ， 在 此 不 妨 假设 访问 根 节点 时 输出 节点 数据 。 若 以 
二 叉 链 表 作 为 存储 结构 ， 则 遍历 算法 如 下 。 
算法 6.1 先 根 遍 历 的 递归 算法 。 





void PreOrderTraverse (BiTree T) 
{ 
/* 先 根 遍历 二 叉 树 */ 
if(T) 


Qp 





算法 6.2 中 根 遍历 的 递归 算法 。 





算法 6.3 后 根 遍历 的 递归 算法 。 下》 





除了 上 述 3 种 遍历 方式 以 外 ， 二叉树 还 有 一 种 层次 遍历 方式 。 该 方式 是 以 “从 上 到 下 ， 
从 左 到 右 ” 的 次 序 对 二 又 树 进行 遍历 的 ， 即 竖 直方 向 上 按照 树 的 高 度 ( 根 节 点 作为 第 一 层 ) 
一 层 层 向 下 进行 访问 ， 同 一 层 上 按照 从 左 到 右 的 方向 进行 访问 。 如 图 6.11 中 的 二 又 树 ， 其 
对 应 的 层次 遍历 序列 为 -+/a*f-bcde。 

二 叉 树 的 遍历 除了 递归 方法 外 ， 还 有 非 递 归 的 算法 ， 非 递归 算法 执行 效率 较 高 ， 并 且 
能 清晰 地 看 出 遍历 的 执行 过 程 ,下 面 以 二 叉 树 的 中 根 遍 历 为 例 , 给 出 其 非 递 归 的 遍历 算法 。 
根据 遍历 二 叉 树 的 特点 可 知 ， 用 栈 结构 可 以 很 容易 地 实现 非 递归 遍历 算法 。 

算法 6.4 ”中 根 遍 历 的 非 递归 算法 。 


| 
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Push (S,p); 
P=p->lchild; 
} 
Else{ // 著 根 节点 为 空 , 则 访问 根 节点 ,遍历 其 右 子 树 
Pop (S,p) + 
printf ("%c",p->data) ; 
p=p->rchild; 
} 
} 
} 





2. 根据 遍历 序列 构造 二 又 树 


a) ee 

HGR SOT GA wz SLL, CET SOE AT A 得 到 的 序列 中 ， 第 一 个 
节点 肯定 是 二 叉 树 的 根 节点 (Roob。 在 其 对 应 的 中 根 序 页 中 我 | Root 结 点 ， 该 节点 可 以 将 
中 根 序列 划分 成 前 后 两 个 子 序列 ，Root 节点 之 前 的 部 分 子 树 的 中 根 序列 (LeftPart)， 之 
后 的 部 分 是 右 子 树 的 中 根 序列 (RightPart)。 NX 

ee pale Ne 部 分 。 在 先 根 序列 中 的 左 子 序列 的 第 一 
个 节点 肯定 是 左 子 树 的 根 节点 (LeftR ae “序列 的 第 一 个 节点 肯定 是 右 子 树 的 根 节点 
(RightRoot), BRIE DAE TF ROE 中 对 应 的 位 置 ， P 个 根 结 点 (LeftRoot 和 RightRoot) 
又 可 将 LeftPart 及 RightPart 分 别 分 成 前 后 两 部 分 。 wi 去 ， 直 到 所 有 子 序列 划分 为 
空 ， ee et a KT 
(2) 三 叉 树 的 申根 序 和 后 根 序列 可 唯 - 芍 确 定 一 棵 二 又 树 。 
同 理 ， 根 据 二 叉 树 的 遍历 序列 定义 可 知 光 在 对 二 叉 树 进行 后 根 人 遍历 后 得 到 的 序列 中 ， 
最 后 一 个 节点 省 ， 二 又 树 的 根 节点 。 在 其 对 应 的 中 根 序列 中 找到 Root 节点 ,该 节点 可 以 
将 中 根 序列 划分 成 前 后 两 个 子 序列 ，Root 节点 之 前 的 部 分 是 左 子 树 的 中 根 序列 ， 之 后 的 部 
分 是 右 子 树 的 中 根 序列 。 

再 根据 这 两 个 子 序列 找到 后 根 序 列 中 对 应 的 两 部 分 。 在 后 根 序列 中 的 左 子 序列 的 最 后 
一 个 节点 肯定 是 左 子 树 的 根 节点 ， 右 子 序列 的 最 后 一 个 节点 肯定 是 右 子 树 的 根 节点 ， 然 后 
分 别 在 两 个 子 序列 中 找到 对 应 的 位 置 ， 两 个 根 结 点 又 可 将 LeftPart 及 RightPart 分 别 分 成 前 
后 两 部 分 。 如 此 继续 下 去 ， 直 到 所 有 子 序列 划分 为 空 ， 便 可 得 到 一 棵 唯一 的 二 叉 树 。 

YER: 已 知 二 叉 树 的 先 根 序列 和 后 根 序列 ， 无 法 唯一 确定 一 棵 二 叉 树 。 因 为 如 果 无 法 
确定 左右 子 树 ， 也 就 无 法 确定 节点 之 间 的 层次 关系 及 左右 次 序 关系 ， 也 就 不 能 确定 这 棵 二 
叉 树 ， 空 树 和 只 有 一 个 节点 的 二 叉 树 除外 。 

例 6.2 已 知 一 棵 二 叉 树 的 先 根 序列 和 中 根 序列 分 别 为 abcdefgh 和 cbafegdh， 请 画 出 这 
棵 二 又 树 。 

实现 该 运算 的 基本 思想 : 根据 上 面 的 定义 可 知 ， 先 根 序列 中 的 第 一 个 节点 为 二 叉 树 的 
根 节点 , 即 二 叉 树 的 根 节 点 为 w 利用 a 将 中 根 序列 划分 成 前 后 两 个 子 序列 , BI cb 和 fegdh， 


Qe 








Py 
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再 根据 这 两 个 子 序列 找到 后 根 序列 中 对 应 的 两 部 分 bc 和 defgh。 先 根 序列 中 的 左 子 序列 的 
第 一 个 节点 肯定 是 左 子 树 的 根 节点 ， 即 b 节点 为 左 子 树 的 根 节点 ， 右 子 序 列 的 第 一 个 节点 
肯定 是 右 子 树 的 根 节点 ， 即 d， 然 后 分 别 在 两 个 子 序列 中 找到 对 应 的 位 置 ， 两 个 根 节点 (6 
和 q) 又 可 将 两 个 子 序列 (cb 和 jegdh) 分 别 划 分 成 前 后 两 部 分 ， 如 此 继续 下 去 ， 直 到 所 有 子 序 
列 划分 为 空 ， 便 可 得 到 一 棵 唯一 的 二 叉 树 ， 如 图 6.12 所 示 。 








图 6.12 9 一 棵 二 又 树 
RN ; 
a E tn AE 
MEH Sng? 如 果 可 以 请 给 出 构造 入 法 : 





建议 读者 思考 ， 如 果 已 知 二 叉 桂 的 沈 根 序列 为 abc， 后 根 序列 为 cha， 请问 能 确定 一 要 
唯一 的 二 叉 树 吗 ? 请 给 出 理由 JJ xk 
‘ X F 1. 


632 二 又 树 的 线索 化 


二 叉 树 的 遍历 JAAR EREE, EE 
够 找到 每 个 节点 ( 除 一 个 和 最 后 一 个 节点 外 ) 的 直接 前 趋 和 直接 后 继 。 但 是 当 二 叉 树 采 月 
二 又 链表 作为 其 在 储 结构 时 ， 因 为 每 个 节点 中 只 有 指向 其 左 、 右 孩子 节点 的 指针 域 ， 只 能 
直接 找到 该 节点 的 左 、 右 孩子 信息 ， 而 一 般 情况 下 无 法 直接 找到 该 节点 在 任 一 序列 中 的 前 
趋 和 后 继 节点 ， 因 此 这 种 信息 只 有 在 遍历 的 动态 过 程 中 才能 得 到 。 因此， 如 果 要 查找 某 个 
节点 在 任 一 序列 中 的 前 趋 或 后 继 节点 时 可 以 采用 以 下 两 种 方式 

(1) 重新 遍历 二 又 树 。 

O 在 每 个 节点 中 增加 两 个 指针 域 来 存放 遍历 时 得 到 的 前 趋 和 后 继 节点 信息 。 

以 上 两 种 方式 要 么 消耗 时 间 ， 使 得 效率 降低 ， 要 么 浪费 存储 空间 。 屠 么 解决 上 述 问 是 
的 好 方法 是 什么 呢 ? 答案 就 是 线索 二 又 树 。 

1 线索 二 又 树 的 定义 

由 62.3 小 节 可 知 ,在 个 节点 的 二 叉 链表 中 合 有 n+1 个 空 指针 域 , 可 以 利用 这 些 空 指 
针 域 ， 存 放 节 点 在 某 种 遍历 次 序 下 的 前 趋 和 后 继 的 信息 ， 这 种 指向 其 前 趋 和 后 继 的 指针 域 
称 为 “线索 ”， 加 上 线索 的 二 又 树 称 为 线索 二 又 树 (Threaded Binary Tree). 
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2. 线索 二 又 树 的 节点 定义 


为 了 区 分 一 个 节点 的 指针 域 到 底 是 指向 其 孩子 的 还 是 指向 线索 的 ， 需 要 在 每 个 节点 中 
增加 两 个 线索 标志 域 ， 节 点 的 结构 由 以 下 五 个 部 分 组 成 。 


| ichita | Itag | data | rtag | rehild | 












































Hp: 
in, a 
1 lchild 域 指示 节点 的 直接 前 趋 
sg penny emia 
1 rchild 域 指示 节点 的 直接 后 继 
在 如 图 6.13(a) 所 示 的 中 根 线索 二 又 树 中 ， 它 的 线索 链表 如 图 6:13(b) 所 示 。 图 中 的 实 线 
表示 指针 ， 虚线 表示 线索 。 节 点 C 的 左 线索 为 空 ， 表示 C 是 中 根 序 列 的 开始 节点 ， 它 没 有 
前 趋 ， 节 点 的 右 线索 为 空 ， 表 示 EE 是 中 根 序列 的 终端 节 没 显然 ， 在 线索 
二 叉 树 中 ， 一 个 节点 是 叶子 节点 的 充 要 条 件 为 : 它 的 左右 














NULL=<、~ 
` 


J.) Bets HRI RAR RARER 
下 面 给 出 线索 链表 中 节 和 点 结构 在 C 语言 中 的 类 型 定义 。 














typed Ant DataType; /* DataType 是 线索 二 叉 树 节点 中 数据 的 类 型 ,可 以 为 整 型 、 
字符 型 等 类 型 ， 此 处 假设 为 整 型 */ 
typedef struct BiThrNode 





DataType data; // 结 点 的 数据 元 素 
struct BiThrNode *lchild,*rchild;  ”// 左 右 孩 子 指针 
int ltag,rtag; 
} BiThrNode, *BiThrtree; 
由 该 节点 结构 构成 的 二 叉 链 表 作 为 二 叉 树 的 存储 结构 时 ， 称 之 为 线索 链表 。 
3， 二 又 树 的 线索 化 
对 二 叉 树 按照 一 定 的 次 序 进行 遍历 ， 对 节点 的 操作 是 检查 当前 节点 的 左右 指针 域 是 否 
为 空 ， 若 为 空 则 用 线索 取代 空 指针 ， 使 其 指针 域 指向 其 直接 前 趋 或 后 继 节 点 ， 并 修改 其 线 
索 标 识 域 为 1， 该 过 程 称 为 二 又 树 的 线索 化 。 
为 此 ， 增加 一 个 指针 pre， 使 其 始终 指向 刚刚 访问 过 的 节点 ， 指 针 忆 指向 当前 正在 访问 
的 节点 ， 则 有 节点 *pre 是 节点 *p 的 前 趋 ， 而 *p 是 *pre 的 后 继 。 


en 
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下 面 以 中 根 线索 二 又 树 为 例 给 出 线索 化 的 算法 : 线索 化 的 过 程 其 实 就 是 遍历 的 过 程 ， 
唯一 区 别 在 于 线索 化 时 对 节点 的 操作 是 修改 节点 的 空 指针 使 其 指向 前 趋 或 后 继 的 线索 。 

算法 6.5 二叉树 的 中 根 线索 化 。 

算法 描述 如 下 。 

车 节点 *p 的 指针 域 为 空 ， 则 修改 其 ltag( 或 rtag) 为 1。 

若 节点 z 的 前 趋 节点 *prel=NULL， 则 进行 如 下 操作 。 

O 若 节点 *pre 的 右 线 索 标志 已 建立 ( 即 *pre->rtag 一 1)， 则 邻 pre->rchild 指向 其 中 序 前 
趋 节点 *p 的 右 线索 。 

© Hyp 的 左 线 索 标志 已 建立 ( 即 *pre->ltag==1), WW p->lchild 指向 其 中 序 前 趋 节 
点 *pre 的 左 线 索 。 

图 将 pre 指向 刚刚 访问 过 的 节点 *p( 即 pre=p), 则 在 下 一 次 访问 一 个 新 节点 *p IY, *pre 


为 其 前 趋 节点 。 
根据 线索 链表 中 的 节点 


BiThrNode *pre; 
void InThreading (BiThrNode *p) 
{ 

if (p) 


InThreading ee, 


wiles oe 
if (p-> 


A 
NO 


LL) 


if oe 


pre->rchild=p; 
if (p->ltag==1) 
p->lchild=pre; 
} 

pre=p; 

InThreading (p->rchild) ; 

} 
} 








SER, FEAH AA Be 1 
量 ， 初 值 应 为 NULL*/ 


左 子 树 线索 化 */ 
en p->ltag= 线索 标志 */ 
E ye 右 线索 标志 */ 


/* *p 无 右 子 树 */ 

/* 右 线索 pre->rchild 指向 *p*/ 
/**p 无 左 子 树 */ 

/* 左 线索 p->rchild 指向 *pre*/ 


/* 递 归 右 子 树 线索 化 */ 


/* 二 叉 树 的 中 序 线索 化 算法 */ 


读者 可 以 根据 此 算法 写 出 先 根 线索 化 和 后 根 线索 化 算法 ， 请 课 下 思考 。 

4. 线索 二 又 树 的 遍历 

在 线索 二 又 树 中 直接 查找 某 节点 的 前 趋 和 后 继 节点 时 不 必 重 新 遍历 ， 使 得 查找 效率 大 
大 提高 了 。 可 以 很 方便 地 求 得 节点 在 先 根 、 中 根 和 后 根 次 序 下 的 前 趋 节点 和 后 继 节 点 。 

(1) 求 节点 p 在 中 根 线 索 二 又 树 中 的 后 继 节 点 。 

© 车 p 的 右 子 树 为 空 ， 即 p->rtag=1， 则 p->rchild 指向 p 的 后 继 节点 。 

© 若 p 的 右 子 树 不 为 空 ， 即 p->rtag=0, 根据 中 根 遍 历 的 规律 可 知 , p 的 后 继 必 是 其 右 


W 
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子 树 中 第 一 个 中 序 遍历 的 节点 ， 即 右 子 树 中 最 左下 的 节点 。 如 图 6.13 所 示 ，4 的 后 继 节 点 
是 E。 


算法 6.6 在 中 根 线索 二 又 树 中 求 节点 直接 后 继 的 算法 。 





sme a 
@ 如 果 p HAE THN, H p> jp->ichild 指向 的 前 趋 节点 。 


@ 如 果 p 的 左 子 树 不 为 空 ， pp 万 的 前 趋 节点 必 


前 趋 节点 是 B。 
算法 6.7 EMRA 


如 图 6.13 所 示 ，4 的 中 序 





(3) 求 节点 在 后 根 线索 二 又 树 中 的 前 趋 节点 。 

O WR p 的 左 子 树 为 空 , 即 p->ltag=1， 则 p->lchild 指向 p 的 前 趋 节 点 。 在 图 6.14 中 ， 
五 的 前 趋 是 B，F 的 前 趋 是 G 

© WR p 的 左 子 树 不 为 空 ， 即 p->ltag=0， 则 : 


Gs 
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若 疡 的 右 子 树 不 为 空 , 则 p->rchild 所 指 节点 ( 即 其 右 孩 子 节点 ) 为 其 前 趋 , 在 图 6.14 H, 
A 的 前 趋 是 E; 
车 p 的 右 子 树 为 空 ， 则 p->lchild 所 指 节点 ( 即 其 右 孩 子 节点 ) 为 其 前 趋 ， 在 图 6.14 中 ， 
的 前 趋 是 Fe 
(4) 求 节点 p 在 后 根 线索 二 叉 树 中 的 后 继 节点 。 
O 如 果 p 是 根 节点 ， 则 其 后 继 为 空 。 
© WR p 是 其 双亲 的 右 孩 子 ， 则 pp 的 双亲 节点 为 其 后 继 节点 , 在 图 6.14 中 , E 的 后 继 
是 4。 
© WRp 是 其 双亲 的 左 孩 子 ， 而 且 p 没有 兄弟 节点 ， 则 pp 的 双亲 节点 为 其 后 继 节 点 ， 
在 图 6.14 中 ，F 的 后 继 是 E。 
© WR p 是 其 双亲 的 左 孩 子 ， 但 是 p 有 兄弟 节点 ， 则 p 的 后 继 是 其 双亲 的 右 子 树 中 后 
根 遍 历 的 第 一 个 节点 ， 即 右 子 树 中 “最 左下 的 叶子 节点 ”， 如 图 -6M 命中 ，B 的 后 续 后 继 是 双 
亲 4 的 右 子 树 中 最 左下 的 叶子 节点 H, 注意 下 是 该 子 树 中 “最 在 下 ”的 节点 , 但 它 不 是 叶子 。 






































图 6.14 后 根 线索 二 叉 树 


由 上 述 讨论 可 知 ， 在 后 根 线 索 树 中 ， 仅 从 p 出 发 就 能 找到 其 后 根 前 趋 节点 ， 而 查找 p 
的 后 根 后 继 节 点 ， 仅 当 p 的 右 子 树 为 空 时 ， 才 能 直接 由 p 的 右 线 索 p->rchild 得 到 ， 否 则 必 
须知 道 p 的 双亲 节点 才能 找到 其 后 续 后 继 节 点 。 因 此 ， 如 果 线 索 二 叉 树 中 的 节点 没有 指向 
其 双亲 节点 的 指针 ， 就 可 能 要 从 根 节点 开始 进行 后 根 遍历 才能 找到 节点 p 的 后 续 后 继 。 
此 可 见 ， 线 索 对 查找 指定 节点 的 后 续 后 继 并 无 多 大 帮助 。 

思考 题 ， 写 出 后 根 线索 二 又 树 中 求 节点 前 趋 和 后 继 的 算法 。 

(5) RHA p 在 先 根 线索 二 又 树 中 的 前 趋 节点 。 

O 如 果 p HETRE, E p->ltag=1， 则 p->lchild 指向 p 的 前 趋 节点 。 

© WR p 的 左 子 树 不 为 空 ， 即 p->ltag=0， 则 : WR p 是 双亲 的 左 孩 子 ， 那 么 p 的 前 
趋 是 其 双亲 节点 ， 如 果 p 是 双亲 的 右 孩 子 ， 那 么 p 的 前 趋 是 其 双亲 左 子 树 中 先 根 遍 历 的 最 


后 一 个 节点 。 





























(6) 求 节点 p 在 先 根 线索 二 叉 树 中 的 后 继 节点 。 
@ WR p HEF AZ, BM p->rtag=1， 则 p->rchild 指向 p 的 后 继 节点 。 





数据 结构 (C 语言 版 ) o) 


@ MR p 的 右 子 树 不 为 定 ， 即 p->rtag=0， 则 : WR p AETH, WA p 的 后 继 是 其 
ETR: WR p RAETH, WA p 的 后 继 是 其 右 子 树 的 根 。 

算法 6.8” 写 出 遍历 中 根 线索 二 又 树 的 算法 。 

算法 描述 :遍历 某 种 次 序 的 线索 二 叉 树 ， 只 要 从 该 次 序 下 的 开始 节点 出 发 ， 反 复 找到 
节点 在 该 次 序 下 的 后 继 ， 直 至 终端 节点 。 这 对 于 中 根 和 先 根 线索 二 又 树 而 言 是 十 分 简单 的 ， 
无 需 像 非 线索 树 的 遍历 那样 ， 引 入 栈 来 保存 留待 以 后 访问 的 子 树 信息 。 





i FMR UE ORIN 所 以 do 语句 终 直 条件 是 p 为 NULL， 显 然 该 算 
PRAM SAH Om), AAALAC, HERR, Blk, H 
AS SORE RAR A 下 的 前 趋 和 后 继 ,| 其 存储 结构 采用 线索 村 为 宜 。 


` 


本 节 介绍 的 线索 二 又 mame. 但 在 许多 应 用 中 常常 只 用 到 右 


线索， 而 没有 必要 设立 大 线索 。 a 


63.3 pA 


(1) 定义 素 类 型 。 





(2) 编写 程序 实现 各 项 功能 。 


EE 
Gs 
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AS 
mè 独立 实践 er 


试 给 出 二 又 树 中 根 、 eae va 


ok 


AY 
现实 中 的 问题 往往 on an 又 树 进行 表示 ， 因 此 本 
ae | 对 应 关系 ， 并 储 表示 及 其 遍历 。 
6.4.1 树 的 we 
fk Sa RT 
链表 表示 法 及 孩子 兄弟 链表 表示 法 。 
1. 双亲 链表 表示 法 


双亲 链表 表示 法 是 指 利 用 树 中 每 个 节点 都 具有 唯一 的 双亲 节点 的 性 质 ， 用 一 个 连续 的 
存储 空间 来 存储 树 中 的 节点 信息 ， 同 时 为 每 个 节点 附加 一 个 指针 域 parent， 用 于 指向 其 双 
亲 节 点 所 在 的 位 置 ， 这 样 就 可 唯一 地 表示 一 棵 树 。 其 节点 的 结构 如 图 6.15 所 示 。 


6.15 “双亲 链表 表示 法 中 节点 的 结构 
下 面 给 出 双亲 链表 表示 法 中 节点 结构 ， 在 C 语言 中 的 类 型 定义 。 


Gs 





int parent; /* 双 亲 位 置 域 */ 
}PTnode; 
Typedef struct PTree 
{ 

PTnode nodes [MAX_TREE NODE]; 

int ny /* 树 中 的 节点 数 */ 
} 


图 6.16 所 示 为 一 棵 树 及 其 双亲 链表 表示 的 结 点 结构 。 





图 6. 16 出 及 其 双 末 链 表 表 示 法 


i 16 可 ond RR pris isnt parent 是 向 所 链接 的 ， 因此 查找 某 个 节点 的 
aa ii HH 下 面 的 孩子 链 




















SANE UT ERIE a x 
2: 孩子 链表 表示 法 X N d 
HFRP LAT & Ff, ‘mit, 当 采 用 多 重 链 表 来 表示 度 为 上 的 树 时 ， 每 
个 节点 内 要 设置 k 条 链 指向 其 孩子 节点 。 在 n 个 节点 的 树 中 ， 其 空 指针 域 的 数目 是 


kn-(n-1)=n(k-1)+1， 这 将 造成 极 大 的 空间 浪费 。 图 6.16 中 度 为 3 的 树 的 存储 结构 如 6.17 所 
示 ， 其 对 应 的 空 指针 域 为 17。 














A617 树 的 孩子 链表 表示 法 
如 果 根 据 每 个 节点 实际 的 孩子 数 设置 指针 域 ， 并 在 节点 内 增加 一 个 度数 域 用 来 表示 该 














节点 所 指示 的 节点 数 ， 虽 然 节省 了 储存 空间 ， 但 是 给 运算 带 来 了 不 便 。 
那么 最 好 的 表示 方法 是 将 每 个 节点 的 孩子 节点 进行 排列 ， 将 其 看 成 一 个 线性 表 ， 且 以 























数据 结构 (C 语言 版 ) 





单 链表 作为 其 存储 结构 ， 则 n 个 节点 有 n 个 孩子 链表 (叶子 的 孩子 链表 为 空 表 )， 同 时 在 多 
个 节点 上 附加 一 个 指针 指向 其 孩子 节点 构成 的 单 链表 ， 如 图 6.18 所 示 。 














‘ (b) A TIR ERRI 
NJ 图 6318 图 6.16 中 树 的 孩子 链表 表示 法 及 孩子 双亲 链表 表示 法 
下 面 给 出 孩子 链表 表示 法 中 节点 的 结构 在 C 语言 中 的 类 型 定义 。 

















typedef struct CTNode // 孩 子 节点 结构 
{ 
int child; /* 孩 子 结 点 序号 */ 
struct CTNode *next; 
}*ChildPtr; /* 孩 子 链表 结 点 */ 
typedef struct // 双 亲 结 点 结构 
{ 
DataType data; /* 树 结 点 数据 */ 
ChildPtr firstchild; /* 孩 子 链表 头 指针 */ 
}CTBox; 


typedef struct 
{ 
CTBox nodes [MAX TREE NODE]; 


Ge 


int n; 
} 

孩子 链表 表示 法 对 于 查找 某 个 节点 的 孩子 非常 容易 , 但 是 查找 其 双亲 节点 又 比较 麻烦 ， 
为 此 可 以 把 双亲 链表 表示 法 和 孩子 链表 表示 法 结合 起 来 ， 即 孩子 双亲 链表 表示 法 ， 该 方法 
在 双亲 节点 结构 中 附加 一 个 双亲 指示 域 ， 如 图 6.18(b) 所 示 。 

3 孩子 兄弟 链表 表示 法 

孩子 兄弟 链表 表示 法 和 二 又 树 的 二 又 链表 表示 完全 一 样 ， 它 采用 两 条 链 分 别 连接 第 一 
个 孩子 和 其 下 一 个 兄弟 节点 ， 分 别 命名 为 firstchild 和 rightsibling， 即 可 得 树 的 孩子 兄弟 链 
表 表 示 结 构 。 其 节点 结构 如 图 6.19 所 示 。 

第 一 个 孩子 结 点 ”数据 域 ” 右 兄弟 结 点 


iri > 








图 6.19 FREER me 
下 面 给 出 孩子 兄弟 链表 表示 法 中 节点 结 — 的 类 型 定义 。 


typedef struct CSnode 


{ 
Datatype data; /* 数 据 A 
Struct CSnode *first: rightsibling 


ee 
一 个 兄弟 节点 */ > 
}CSnode, *cstri ,小 Xi 


例如 ， 图 6.16 中 树 的 的 臣子 兄弟 链表 如 图 620 所 东 。 这 种 存储 结构 的 最 大 优点 是 , 它 可 
OS 作 ， 因 此 ， 可 利用 二 又 树 的 算法 来 实现 
对 树 的 操作 








6.20 图 6.16 中 树 的 二 叉 链表 表示 法 


例如 ， 若 要 访问 节点 的 第 i 个 孩子 节点 ， 只 需要 沿 着 firstchild 指针 找到 第 一 个 孩子 节 
点 ， 然 后 沿 着 孩子 节点 的 rightsibling 指针 连续 走 天 1 步 即 可 。 这 种 存储 结构 实际 上 是 将 一 
棵 树 转换 成 一 棵 对 应 的 二 又 树 ， 这 样 有 利于 实现 树 和 森林 的 各 种 操作 。 因 此 这 是 一 种 较为 


普遍 的 树 的 存储 方式 。 


数据 结构 (C 语言 版 ) 《 7) 


6.4.2 ” 树 、 森 林 与 二 又 树 的 转换 


从 树 的 孩子 兄弟 链表 表示 的 定义 可 知 ， 这 种 存储 结构 其 实 就 是 将 一 棵 树 转换 成 一 棵 二 
又 树 ， 然 后 进行 存储 。 因 此 ， 一 棵 树 能 够 唯一 地 转换 成 一 棵 二 又 树 ; 反 之， 一 棵 二 又 树 也 
能 够 还 原 成 唯一 的 一 棵 树 。 此 外 ， 因 为 树 的 根 节 点 没有 兄弟 节点 ， 因 此 在 树 转换 得 到 的 二 
又 树 中 ， 其 根 节 点 的 右 子 树 必 为 空 。 如 果 将 森林 中 的 每 一 棵 树 的 根 节点 看 作 同 一 层 的 有 序 
排列 的 兄弟 节点 ， 则 森林 也 可 以 转换 成 一 棵 二 又 树 。 

. 树 、 森 林 转 换 成 二 又 树 


树 中 每 个 结 点 可 能 有 多 个 孩子 ， 但 二 又 树 中 每 个 结 点 最 多 只 能 有 两 个 孩子 。 要 把 树 转 
换 为 二 又 树 ， 就 必须 找到 一 种 结 点 与 结 点 之 间 至 多 用 两 个 量 说 明 的 关系 。 树 中 每 个 结 点 最 
多 只 有 一 个 最 左边 的 孩子 (长 子 ) 和 一 个 右 邻 的 兄弟 ， 这 就 是 我 们 要 找 的 关系 。 按 照 这 种 关 
系 很 自然 地 就 能 将 树 转化 成 对 应 的 二 叉 树 : K 

(1) 在 所 有 兄弟 结 点 之 间 加 一 连 线 ; aN 
(2) 对 每 个 结 点 ， 除 了 保留 与 其 长 子 的 连 线 外 ， 的 
使 TNE, ENON AE N 式 ， 它 已 是 一 棵 二 又 树 ， 若 按 顺 
时 针 方向 将 它 旋 转 约 45” 就 更 清楚 地 变 为 图 (c) 所 示 的 二 叉 树 。 由 于 树 根 没有 兄弟 ， 故 树 转 
化 为 二 又 树 后 ， 二 又 树 的 根 结 点 的 右 子 树 必 为 空 。 






































6.21 ” 树 转化 成 二 叉 树 


将 一 个 森林 转换 为 二 又 树 的 方法 是 : 现 将 森林 中 每 一 棵 树 变 为 二 又 树 ， 然 后 将 各 二 又 树 的 
根 结 点 视 为 兄弟 连 在 一 起 。 例 如 在 图 6.22 中 ，(b) 是 (c) 的 转换 结果 ，(c) 是 (b) 旋 转 后 的 二 又 树 。 


eens we 
00 OO © O-O-O z 
(a) © 
图 6.22 森林 转化 成 二 叉 树 





© 一 一 Sy 
2， 二 又 树 到 树 、 森 林 的 转换 


同样 ,也 有 一 种 自然 的 方式 把 二 又 树 转换 到 树 和 森林 ; 若 结 点 x 是 其 双亲 y 的 左 孩子 ， 
则 把 x 的 右 孩子 ， 右 孩子 的 右 孩子 ，…… ， 都 与 y 用 连 线 连 起 来 ， 最 后 去 掉 所 有 双亲 到 右 
孩子 的 连 线 。 如 图 6.23 所 示 ， 将 (a) 所 示 二 又 树 通过 上 述 方法 转换 成 (c) 所 示 森 林 。 


© 

















6.4.3 ” 树 和 森林 的 遍历 XK 
树 和 森林 主要 有 两 种 谢 历 方式 : —_ 


， 树 的 遍历 A 
ie aaa X> 

@ WHR 2)» ; 

© 按照 从 左 到 右 的 顺序 先 根 道 历 根 节点 wie 
(2) 后 根 遍历 过 各 
nia 


@ 按照 
2 mi 
a 对 图 gee tee ees E E ABCEFGHDIJ 
All BEHFGCIIDA.. 
请 读者 思考 ， 该 树 对 应 的 二 又 树 的 先 根 、 中 根 和 后 根 遍 历 序列 与 该 树 的 先 根 、 后 根 饥 
历 序列 之 间 有 何 关系 。 


2， 森林 的 遍历 


(1) 先 根 遍历 森林 过 程 如 下 。 

若 森 林 非 空 ， 则 : 

O 访问 森林 中 第 一 棵 树 的 根 节点 。 

© 先 根 遍 历 第 一 棵 树 的 根 节点 的 子 树 森 林 。 

© 先 根 遍 历 除 第 一 棵 树 之 外 其 他 的 树 构成 的 森林 。 

(2) 后 根 遍 历 森林 过 程 如 下 。 

© 后 根 遍 历 第 一 棵 树 的 根 节点 的 子 树 森 林 。 

© 访问 森林 中 第 一 棵 树 的 根 节点 。 

© 后 根 遍 历 除 第 一 棵 树 之 外 其 他 的 树 构成 的 森林 。 

例如 ， 对 图 6.22(a) 所 示 的 森林 进行 先 根 遍历 和 后 根 遍 历 ， 得 到 的 序列 分 别 是 ABCDEFGHI 


W 


和 了 BADEFCHIG。 
请 读者 思考 ， 该 森林 对 应 的 二 又 树 的 先 根 、 中 根 和 后 根 遍 历 序列 与 该 森林 的 先 根 、 后 
根 遍 历 序列 之 间 有 何 关 系 。 


65 ” 哈 夫 曼 树 及 其 应 用 





Ae anst 
文件 传输 编码 问题 


现实 生活 中 为 了 文件 的 安全 及 传输 速度 ， 常 需要 对 文件 进行 加 密 和 压缩 ， 哈 夫 曼 
(Huffman) 编 码 是 数据 压缩 技术 中 的 一 种 无 损 压缩 方法 ， 它 既 实现 了 加 密 又 具有 压缩 功能 。 
常用 于 文本 、 图 像 的 压缩 ， 如 TXT 文件 、JPG 文件 等 。 _/ 

现 需要 实现 如 下 的 功能 ， 利 用 哈 夫 曼 编码 实现 文件 传输 时 的 编码 及 解码 问题 。 

本 节 以 哈 夫 曼 (Hufimnan) 树 为 例 介绍 二 又 树 的 具 sis AIL 
是 一 种 应 用 非常 广泛 的 树 结构 。 C4 
6.5.1 基本 概念 > xN 

TT RENN. ISARN: 

(1) 路 径 ， 指 树 中 的 一 个 节点 到 节点 之 间 的 分 支 序列 。 

(2) 路 径 长 度 ， 指 路 径 上 的 分 支 数目 。 Xe 

G) MIDIER: MEENAI PA ain RIE 

(4) 节点 的 权 : 在 Tt ， 而 为 节点 赋予 的 一 个 实数 。 

(5) 节点 的 带 权 路 径 长 度 ， 指 该 节点 到 根 节点 之 间 的 路 径 长 度 乘 以 该 节点 上 的 权 值 。 

(9 村 的 末路 长度， 禁 中 所 有 时 汉 共 二 的 带 权 路 径 长 度 之 和 ， 通 党 记 为 

N WPL- Ý w, XI 












































其 中 , n 表示 树 中 叶子 节点 的 总 个 数 ，W; 和 L; 分 别 表 示 第 i 个 叶子 节点 的 权 值 和 根 到 
该 叶子 节点 的 路 径 长 度 。 个 带 权 叶子 节点 所 构成 的 二 叉 树 中 ，WPL 最 小 的 二 叉 树 称 为 最 
优 二 叉 树 或 哈 夫 曼 树 。 

例 6.3 以 权 值 分 别 为 6、7、3、2 的 四 个 节点 作为 叶子 节点 ,可 以 构造 多 棵 编码 的 二 又 
树 ， 且 带 权 路 径 长 度 不 同 ， 如 图 6.24 所 示 。 


© 
Q Q © 
Ki 
O OOO Oo 
(a) (b) 


图 6.24 ” 带 权 路 径 长 度 不 同 的 二 叉 树 





(c) 


G 


© we 树 
(9 — ~N 


(a) WPL=7X2+6X 2+3 X2+2X2=36. 

(b) WPL=7 X 1+6 X 2+3 X 3+2 X 3=34. 

(c) WPL=7 X3+6 X 343 X 2+2 X 1=47. 

其 中 ，(b) 树 的 WPL 最 小 ， 它 就 是 哈 夫 曼 树 。 可 以 验证 ， 将 权 值 大 的 节点 尽量 靠近 根 
节点 ， 会 使 得 WPL 的 值 最 小 。 
6.5.2 ”了 哈 夫 曼 树 的 构造 

1. 哈 夫 曼 树 的 构造 方法 

哈 夫 曼 树 的 构造 过 程 可 以 描述 如 下 。 

(1) 由 给 定 的 n 个 权 值 Wo Wi Ws, t, Wi EIR n ERZI HIRI F={T,, To To, ee 
7,}， 其 中 每 棵 二 叉 树 7; 中 都 只 有 一 个 权 值 为 WW 的 根 节点 。 其 左右 子 树 均 空 。 
te ltr tn bet 
Oe R ARAETA A 两 棵 树 时 ， 可 以 从 中 
任 选 两 棵 ) 分 别 作为 左右 孩子 来 构造 一 棵 新 的 二 叉 树 ,新 三 根 节点 的 权 值 为 左右 孩子 
权 值 之 和 。 ;六 

i ng oe 



































例 6.4 四 个 叶子 节点 的 权 值 分 别 为 ODS: ;根据 上 述 方法 构造 一 棵 哈 夫 曼 树 ， 给 
出 其 构造 过 程 。 7 f 
构造 过 程 如 图 6.25 所 示 。 XS 
,> ce (a 
Y, ¢ 
A OQ Eval Q © 
©00@Os° Xs O @ 50 Q 
NoP GY © (2) © Ò 
i 
(PAHS. 2 在 F 中 吉 掉 7、5， 
mn iste aA MaN iil 


图 6.25 险 夫 曼 树 的 构造 过 程 
2. 哈 夫 曼 树 的 存储 结构 
哈 夫 曼 树 的 构造 过 程 可 以 得 出 : 哈 夫 曼 树 中 只 有 度 为 2 的 节点 ， 根 据 二 又 树 的 性 质 
3 可 知 ， 一 棵 及 个 叶子 节点 的 哈 夫 曼 树 共 有 2n-1 个 节点 。 可 以 采用 一 个 一 维 数组 存储 二 
又 树 的 所 有 节点 ， 每 个 节点 需要 存储 其 孩子 节点 和 双亲 节点 的 存储 位 置信 息 。 这 样 就 可 唯 
一 地 表示 一 棵 哈 夫 曼 树 。 节 点 的 结构 如 图 6.26 所 示 。 
结 点 权 值 双 订 节点 下 标 。 ATAF A TAA FR 
vm | owen | wa | md | 
图 6.26 BABA ANA 
下 面 给 出 哈 夫 曼 树 的 存储 结构 。 
#define n 4 


#define m 2*n-1 
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当 节 点 没有 双亲 节点 或 孩子 节点 时 ， 其 相应 的 链 域 值 为 -1， 并 且 将 树 中 的 叶子 节点 集 
中 存储 在 前 个 单元 中 ， 后 n-1 个 单元 存储 其 余 非 叶 子 节点 。 


3. 哈 夫 曼 树 的 构造 算法 
哈 夫 曼 给 出 了 一 个 构造 哈 夫 曼 树 的 方法 ， 即 哈 夫 曼 算法 。 


算法 69， 哈 夫 曼 树 的 构造 算法 。 
算法 描述 如 下 。 Ae 
(1) BORE ALO Ae hts 1 AH RHEE BU 


(2) 将 n 个 节点 的 权 值 依次 输入 到 前 n 个 存储 单元 

G) 再 进行 mi 次 合并 ， 共 产生 n-1 WK A nmi 个 存储 单元 中 。 每 次 合 
并 的 步骤 如 下 。 

O 在 当前 森林 的 所 有 节点 中 ， 选 取 双 re ro toy Éro 


户 的 权 值 和 作为 新 的 节点 r HK r BG ae 个 存储 单元 中 。 
ry All ra HTE 相应 地 修改 ri, r2 的 parent 







@ 修改 + 的 Ichild 和 和 
域 的 值 为 + 的 下 标 值 。 wu 





smalll=tree[j] .weight; 

p2=pl; 

pl=j; 

} 

else 

if (tree[j] .weight<smal12) 
{smal12=tree[j].weight; /* 改 变 次 小 权 及 位 置 */ 
p2=j; 

} 

tree[p1] .parent=itl; 

tree[p2] .parent=it1l; 





tree[i] .lchild=p1+1; /* 最 小 权 根 节点 是 新 节点 的 左 孩子 , 分 量 号 是 下 标 加 1*/ 
ee eee / OA SAE AUER EAT 


tree[i] .weight=tree[p1] .weight+tree[p2] "wet 
} \ 


}/*Huffman*/ i 


例 6.5 已 知 权 值 集合 为 {6，2，3，9，12、24 和 M10，8}， 根 据 哈 夫 曼 树 的 构造 算法 ， 构 
造 一 棵 哈 夫 曼 树 树 ， 并 给 出 结 点 数组 的 初始 状态 和 最 终 状态 ， 如 图 6.27 所 示 。 


weight | parent i i j i parent | lchild rchild 















































9 2 1 
11 0 8 
12 3 7 
13 9 6 
14 10 4 
14 5 11 
= 13 12 

(a) 初始 状态 (b) 最 终 状态 


图 6.27” 险 夫 曼 树 结 点 数组 的 初始 状态 和 最 终 状 态 


为 n=8， 所 以 数组 的 总 长 度 为 2n-1=15, 根据 算法 描述 可 知 , 数组 的 初始 状态 只 有 叶 
子 结 点 ， 图 中 的 -1 表示 其 双亲 或 者 孩子 结 点 为 空 。 最 终 状 态 则 为 构造 的 哈 夫 曼 树 。 若 相应 
的 权 值 集合 对 应 的 字符 集合 为 {A、B、C、D、E、F、G、H}， 则 哈 夫 曼 树 如 图 6.28 所 示 。 
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6.5.3 MARANA 


哈 夫 曼 编码 是 数据 压缩 技术 中 的 二 ERRAN. 在 数据 通信 中 ， 需 要 对 通信 信息 
以 二 进 制 的 0、1 进行 编码 。 tt CDDCA”， 则 传送 前 先 将 其 进 
行 编码 ， 即 将 报 文中 的 字符 转换 成 二 进 制 的 0、1 序列 。 仅 含有 四 种 字符 ， 因 此 只 需 
要 长 度 为 2 的 二 ER X 

若 A、B、C、D 这 四 个 字 seg So. 11， 则 上 述 七 个 字符 的 报 文 可 
翻译 成 “0001001011111000”， 报 文 总 长 度 对 方 接收 到 报 文 后 ， 可 按照 二 位 一 个 
部 分 进行 译 码 ESTRE laine, D eaa. 如 果 对 每 个 字符 设计 
长 度 不 等 的 编 且 让 出 现 次 数 较 多 的 字符 编码 尽 可 能 短 ， 则 总 的 码 长 便 可 减少 。 若 对 
于 字符 A、B、C、D 采用 如 下 编码 : 0，00，1，01， 则 上 述 报 文 可 翻译 成 “000011010”， 
报 文 总 长 度 为 九 位 。 但 是 ， 在 接收 方 进行 译 码 的 时 候 就 会 出 现 问题 ， 如 前 4 位 “0000” 梧 
以 翻译 成 “AAAA” 或 “AAB” 或 “BB” 等 。 因此， 在 设计 长 短 不 等 的 编码 时 ， 必 须 满足 : 
每 个 字符 的 编码 都 不 是 另 一 个 字符 编码 的 前 级 ， 称 这 种 编码 为 前 级 编码 。 

1. 哈 夫 曼 编码 


二 又 树 可 以 实现 字符 的 前 绥 编 码 。 若 将 字 
符 节点 表示 为 叶子 节点 , 节点 上 的 权 值 表示 节 
ale 点 出 现 的 次 数 ， 以 此 就 可 设计 一 棵 哈 夫 曼 树 ， 
全 ojo， 且 约定 二 又 树 中 的 左 分 支 为 0、 右 分 支 为 1， 
coo) 则 每 个 字符 的 编码 可 以 表示 为 从 根 节点 到 叶 
DOD 子 节点 所 经 过 的 分 支 构成 的 0、1 序列 。 通 过 
哈 夫 曼 树 得 到 的 二 进 制 前 缀 编码 又 称 为 哈 夫 
曼 编 码 。 如 果 上 面 报 文中 A、B、C、D 的 频 
度 分 别 为 0.3，0.1，0.2，0.2， 则 其 对 应 的 哈 
夫 曼 树 如 图 6.29 所 示 。 









































Pen 


相应 的 哈 夫 曼 编码 可 以 表示 为 1000100101010011。 
2. 哈 夫 曼 编 码 的 算法 实现 
算法 如 下 。 





所 示 的 哈 夫 曼 树 为 例 ， 则 上 述 算法 求 出 的 哈 夫 曼 编码 如 图 6.30 所 示 。 





图 6.30 ” 哈 夫 曼 编码 的 动态 数组 存储 
6.5.4 用 哈 夫 曼 树 解决 文件 传输 编码 问题 
(1) 定义 哈 夫 曼 树 中 数据 元 素 类 型 。 


数据 结构 ( 语言 版 ) 
一 eS acre 


(2) 编写 程序 实现 各 项 功能 








数据 结构 ( 语言 版 ) 
一 a 
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一 er tae a 








数据 结构 ( 语言 版 ) 
一 ee a 
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getch () 
scanf ("%d", &control); 


} 


在 D 盘 有 一 个 名 称 为 test.txt 的 文件 ， 运 行程 序 之 后 生成 的 密码 文件 为 code.txt， 使 / 
时 需 先 编码 再 解码 。 


ee 独立 实践 


现在 的 程序 要 使 用 必须 先 编码 再 解码 ,如何 改进 能 够 使 程序 直接 将 已 编码 的 文件 解码 ? 


小 结 7; K 
K 
MAXMA ARRIARAN A 被 广泛 地 应 用 于 计算 机 领域 。 
本 章 着 重 介绍 了 二 叉 树 的 概念 、 性 质 和 存储 表示 ;和 又 的 三 种 遍历 操作 ， 线 索 二 叉 树 的 
有 关 概 念 和 运算 ， 同 时 介绍 了 树 、 森 林 与 三 pazimen 树 的 三 种 存储 表示 法 ， 树 和 
森林 的 遍历 法 ; oer E 

















本 章 是 本 书 的 重点 之 一 练 掌握 6.2 一 6.5 or 熟悉 树 和 二 叉 树 的 
定义 和 有 关 术 语 ， 理 解 和 记 住 三 叉 树 的 性 质 ,熟练 党 顺序 存储 和 链 式 存储 结构 。 
遍历 二 又 树 是 二 又 树 中 各 种 运算 的 基础 ， 希 望 读 "ee ag 实现 
二 叉 树 的 其 他 运算 。 二 ed 程 和 有 效 利用 存储 空间 ， 希 望 读者 
热 练 掌握 在 中 根 线索 树 中 ， 查 找 给 定 节 趋 和 后 继 方法 ， 并 能 掌握 树 和 二 叉 树 之 
ne ae 最 后 ， 建 议 读者 理 
解 树 和 森林 的 遍历 、 最 优 二 又 树 的 特性 。 











习 wv 


一 、 填 空 题 


1， 有 一 棵 树 如 图 6.31 所 示 ， 回 答 下 面 的 问题 。 
(1) 该 树 的 根 节点 是 

(2) 该 树 的 叶子 节点 是 

(3) 节点 Ks 的 度 是 

(4) 这 棵 树 的 度 是 

(5) 这 棵 树 的 深度 是 

(6) 节点 Ks 的 孩子 节点 是 

(7) 节点 Ks 的 双亲 节点 是 
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人 人 
O 
G O & 
OG 
© 
图 6.31 一 棵 树 


2. 树 和 二 叉 树 的 三 个 主要 区 别 是 、 、 
3. 从 概念 上 讲 ， 树 与 二 又 树 是 两 种 不 同 的 数据 结构 ， 将 树 转化 为 二 又 树 的 基本 目的 











是 


— X 

4. 一 棵 二 叉 树 的 节点 数据 采用 顺序 存储 结构 ， wala 如 图 6.32 所 示 ， 则 该 
二 叉 树 的 链接 表示 形式 为 D 

123 4 5 67 8 9 10 aS 16 17 18 19 20 21 


belel l Je] Tel | Je ¥ TRA TAT TT TT 





6.32. 数组 t 

5. 深度 为 的 完全 二 叉 树 至 少 We 个 节点 ， 至 多 有 _ DH HRA 

而 下 、 从 左 到 右 的 次 序 给 节点 编号 (从 了 开始 )， 则 编号 最 水 的 叶子 节点 的 编号 是 。 
6. 在 一 棵 二 又 树 中 ， 9 节点 的 个 数 为 二 ， 则 有 no= 


T 节点 最 少 的 vamp, 
8. Hert ili ain FAs abe th 
遍历 结果 ，3 树 分 别 是 
9。 根 据 如 图 6.33 所 示 的 二 双料 ， 回 答 以 下 问题 。 
(1) 其 中 序 遍历 序列 为 : 
(2) 其 先 根 遍历 序列 为 
O) 其 后 根 遍历 序列 为 








和 不 同形 态 的 二 叉 树 可 以 得 到 这 一 





图 6.33 二 叉 树 














第 6 章 树 
© — Sy 
二 、 判 断 题 | 

1. 树 最 适合 用 来 表示 元 素 之 间 具 有 分 支 层次 关系 的 数据 。 ©) 

2. 二叉树 按 某 种 顺序 线索 化 后 ， 任 一 节点 均 处 在 其 孩子 节点 的 前 面 。 ©) 

3. 二叉树 的 先 根 遍历 序列 中 ， 任 意 一 个 节点 均 处 在 其 孩子 节点 的 前 面 。 ©) 

4. 由 于 二 又 树 中 每 个 节点 的 度 最 大 为 2， 所 以 二 又 树 是 一 种 特殊 的 树 。 ©) 

5. 树 的 基本 遍历 策略 可 分 为 先 根 遍历 和 后 根 遍 历 :， 二叉树 的 基本 遍历 策略 可 分 为 先 根 
遍历 、 中 根 遍 历 和 后 根 遍 历 。 人 们 把 由 树 转化 得 到 的 二 叉 树 称 为 这 棵 树 对 应 的 二 叉 树 ， 则 
树 的 先 根 遍历 序列 与 其 对 应 的 二 叉 树 的 先 根 遍历 序列 相同 。 ©) 
三 、 选 择 题 

TN Ee 
(es pe 

A. 16 B. 18 c. AND. 12 

2. 根据 二 又 树 的 定义 ， 具 有 三 won nal om 
A. 3 B. 5 <a 

3. 按照 二 又 树 的 定义 ， “nine 不 同 的 二 ea ) 种 
A. 30 D. 16 


4. 深度 为 5 的 二 IRESE ga. 





A. 5 NN c. 31 o D. 36 
. 设 高 度 为 h 的 二 MER 为 0 和 度 为 2 ag i UAE A 
HEDA )。 y 


A. 2h N. A EA D. h+l 

6. aT ve K -中 根 后 根 遍 历 序列 中 的 相对 次 序 ( e 
A. B 不 发 生 改 变 S C. 不 能 确定 。 D. 以 上 都 不 对 

7. WRZ, Ph 果 为 suwv， 中 根 遍 历 结 果 为 wwtvs， 那 么 该 二 又 树 的 后 根 














WFA o 
A. uwvts B. vwuts C. wuvts D. wutsv 
8. 在 一 棵 非 空 二 叉 树 的 中 序 遍 历 序列 中 ， 根 节点 的 右边 ( e 
A. 只 有 右 子 树 上 的 所 有 节点 B. 只 有 右 子 树 上 的 部 分 节点 
只 有 左 子 树 上 的 部 分 节点 D. 只 有 左 子 树 上 的 所 有 节点 
9. 设 a、5 为 一 棵 二 叉 树 上 的 两 个 节点 ， 在 中 根 遍 历时 ，a 在 b 前 的 条 件 是 (。 )。 
A. a 在 b 的 右 方 B. a 在 4b WA 
C. a 是 b 的 祖先 D. a 是 4b 的 子孙 
10. 如 果 二 叉 树 的 后 根 遍历 结果 为 dabec， 中 根 遍 历 结 果 为 depac， 那 么 该 二 又 树 的 先 
根 遍历 序列 为 (。”)。 
A. ached B. decab C. deabc D. cedba 
11. 根据 使 用 频率 为 五 个 字符 设计 的 哈 夫 曼 编码 不 可 能 是 (。 )。 
A. 111, 110, 10, 01, 00 B. 000, 001, 010, 011, 1 
C. 100, 11, 10, 1, 0 D. 001, 000, 01, 11, 10 


9 
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ee 
12. WA 13 个 值 ， 用 它们 组 成 一 棵 哈 夫 曼 树 ， 则 该 哈 夫 曼 树 共有 ( AMAWA. 
A. 15 B. 25 c. il D. 26 
四 、 简 答题 


1. 根据 二 又 树 的 定义 , 具有 三 个 结 点 的 二 叉 树 有 5 种 不 同 的 形态 , 请 将 它们 分 别 画 出 。 
2. 对 图 6.35 所 示 二 又 树 进行 以 下 操作 。 


F O Des 
图 6.35 二 叉 树 SK 
(1) 分 别 画 出 顺序 存储 结构 和 链 式 存储 结构 ， 站 
(2) 写 出 前 、 中 、 后 根 遍 历 的 序列 ; NN 
(3) 对 该 二 叉 树 进行 中 序 线索 化 ; ~~ 
(4) 并 将 其 转换 成 树 或 者 森林 。 
3， 假 设 一 棵 二 snare in CFHGIKJ, 中 序 序列 为 ABCDEFGHIJK， 请 
画 出 该 树 。 V 
4. 以 数据 集 {4.5.67.1032418} 尖 结 者 点 权 值 ， no 步 图 示 ， 计 算 


其 带 权 路 径 长 度 。 — yX 
=] YA a 
aE XS xh y 


1. 编写 算法 ,> 对 于 一 一 棵 二 叉 树 ， 统 计 其 叶子 节点 的 个 数 。 

2. 编写 算法 : 对 于 一 棵 二 叉 树 根 节点 不 变 ， 将 其 左 、 右 子 树 进行 交换 ， 树 中 每 个 节点 
的 左右 子 树 进行 交换 。 

3. 假设 用 于 通信 的 电文 仅 有 八 个 字母 (a、b、c、d、e、f、g、h) 组 成 ， 字 母 在 电文 中 
出 现 的 频率 分 别 为 0.07、0.19、0.02、0.06、0.32、0.03、0.21、0.10。 试 为 这 八 个 字母 设计 
哈 夫 曼 编码 。 

4. 编写 算法 ， 对 一 棵 以 孩子 兄弟 链表 表示 的 树 统计 叶子 的 个 数 。 

















图 


Ae amt 
校园 电子 导航 平台 
KARN 

当 人 们 到 一 个 陌生 的 地 方 旅游 时 ， 可 能 会 找 导游 为 自己 在 游玩 的 过 程 中 提供 帮助 。 导游 
可 以 提供 很 多 服务 ,如 介绍 参观 景点 的 历史 背景 等 相关 信息 ,推荐 到 下 一 个 景点 的 最 佳 路 径 ， 
解答 旅游 者 所 提出 的 关于 旅游 景点 的 相关 问 询 等 、 对 于 刚 来 到 校园 的 新 生 ， 对 校园 环境 不 扣 
恶 的 情况 也 是 如 此 ， 一 般 都 是 高 年 级 的 学 生 充当 “校园 导游 ”的 角色 。 如 果 能 够 提供 一 个 校 
加 导航 平台 ， 让 新 生 或 来 访 的 客人 自主 地 通过 与 机 器 的 “对 话 ”来 获 得 相关 信息 ， 将 会 节省 
大 量 的 人 力 和 时 间 ， 并 且 所 提供 的 信息 能 向 到 尽 可 能 地 准确 \ 详尽 .一 个 成 功 的 校园 电子 导 
航 平台 可 以 蔡 代 现 实生 活 中 的 ,校园 导游 ”， 更 方便 大 家 查询 校园 的 相关 信息 

校园 电子 导航 平台 应 包含 如 下 的 主体 功能 。 YO 

(1) 显示 校园 平面 图 方便 用 户 直 观 地 看 到 校园 的 全 景 示意 图 ， 并 确定 自己 的 位 置 。 

(2) 为 用 户 提供 对 平面 图 中 任意 场所 相关 信息 的 查询 。 

(8) 为 用 户 提 供 对 平面 图 中 任意 场所 的 问 路 查询 。 
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7.1 图 的 定义 和 术语 





图 (Graph) 是 一 种 较 线性 表 和 树 更 为 复杂 的 数据 结构 。 在 线性 表 中 ， 数 据 元 素 之 间 是 被 
串联 起 来 的 ， 仅 有 线性 关系 ， 每 个 数据 元 素 只 有 一 个 直接 前 趋 和 一 个 直接 后 继 ;， 在 树 形 结 
构 中 ， 数 据 元 素 之 间 有 着 明显 的 层次 关系 ， 并 且 每 一 层 上 的 数据 元 素 可 能 和 下 一 层 中 的 多 
个 元 素 相 关 ， 但 只 能 和 上 一 层 中 一 个 元 素 相关 ; 而 在 图 形 结构 中 ， 节 点 之 间 的 关系 可 以 是 
任意 的 ， 图 中 任意 两 个 数据 元 素 之 间 都 可 能 相关 。 
图 的 定义 : 图 是 由 顶点 的 有 穷 非 空 集合 和 顶点 之 间 边 的 集合 组 成 的 ， 记 作 G=(V(G)， 
E(G))， 简 称 G=(V，E)。 其 中 ，G 表示 一 个 图 ，V 是 图 G 中 顶点 的 集合 ,，E 是 图 G 中 边 的 
集合 ， 如 图 7.1 所 示 。 
对 于 图 的 定义 ， 需 要 明确 以 下 几 个 注意 的 地 方 。 

(1) 线性 表 中 的 数据 元 素 称 为 元 素 ， 树 中 将 数据 元 素 称 为 节点 ， 在 图 中 的 数据 元 素 则 
称 为 顶点 (Vertex)。 
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图 7.1 AG 














(2) 线性 表 中 可 以 没有 数据 元 素 ， 称 其 为 空 表 ;， 树 中 可 以 没有 节点 ， 称 其 为 空 树 ; 但 
是 ， 图 结构 中 不 允许 没有 顶点 ， 因 为 项 点 集合 是 有 穷 非 空 集 。 
(3) 线性 表 中 ， 相 邻 的 数据 元 素 之 间 具 有 线性 关系 ; 树 结构 中 ， 相 邻 两 层 的 节点 间 具 
有 层次 关系 ; 而 图 中 ， 任 意 两 个 顶点 间 都 可 能 有 关系 ， 顶 点 之 间 的 逻辑 关系 用 边 来 表示 ， 
边 集 可 以 是 空 的 。 
7.1.1 各 种 图 定义 4 K 


(1) 无 向 边 (Edge): HWA vi vy ZIRA pn Wine 身边 ， 用 无 序 偶 

对 (vi，vw) 表 示 。 Ca 

(2) 无 向 图 (Undirected graphs): Fes aA 图 7.2(a) 就 是 

一 个 无 向 图 ， 由 于 边 是 无 方向 的 ， pise, eee ivo v HAT RAMA E Ay, v) 
NS 


o vi) Mos v= vi) 
无 向 图 G 表示 为 G1=(V， arse Vor V3» V4 avs}, E={(visv v) (Vis va) (vo 
a (Var v (vse vay Os I ; 次 | 
(3) 有 向 边 (Arc): 车 顶点 六 到 久之 间 的 边 有 万 “ 则 称 这 条 边 为 有 向 边 ， 用 有 序 偶 对 
<vo VRIR: vi RAIE PRAIA o F: 

(4) 有 向 图 (Directed graphs): 图 中 人 两 个 顶点 间 的 边 都 是 有 向 边 的 图 。 图 7.2(b) 就 是 
一 个 有 向 图 , 图 中 连接 顶点 ee a i iem v>, vi EIB, v EMA, 
A<y, pee a 
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(a) AIAG, (b) 有 向 图 G 
图 7.2 无 向 图 和 有 向 图 

有 向 图 G: 表示 为 GAV, E) HP 大 fy， vo vs vats E={<v V>, <vo V>, <V 
V4>，<V4，VI>}。 

注意 : 无 向 边 用 小 括号 “0” 表 示 ， 而 有 向 边 用 尖 括 号 “<>” 表 示 。 

(5) 简单 图 : 不 存在 顶点 到 其 自身 的 边 ， 且 同一 条 边 不 重复 出 现 的 图 。 本 书 中 讨论 的 
都 是 简单 图 。 图 7.3 中 的 两 个 图 都 不 是 简单 图 。 

(6) 无 向 完全 图 : 任意 两 个 顶点 之 间 都 存在 边 的 无 向 图 。 

















第 7 章 
© o 
To 
es 
(a) 到 自身 的 边 (b) 重复 边 
图 7.3 非 简单 图 


性 质 1， 含 有 "个 顶点 的 无 向 完全 图 有 2 条 边 。 


证 明 ， 任 何 一 个 项 点 w 都 和 其 他 nA 个 顶点 wy 有 边 ， 则 这 样 的 边 有 n1 条 共 及 个 
具备 该 特征 的 顶点 ， 因 此 共有 nX (n—1) id: ca 
数 除 以 2。 

图 7.4(a) 就 是 无 向 完全 图 ， 因 为 每 个 顶点 都 要 与 ep TAKE, TK v Al vas 
vee We = NOE, STDIN, 为 由 于 顶点 v 与 顶点 由 连 线 后 ， 
计算 ww 与 mn 连 线 就 是 重复 的 ， 因 此 整体 要 除 b Nea. 

(1) 有 向 完全 图 ， 任意 两 个 项 点 之 间 者 和 力 向 相反 的 两 条 弧 的 有 向 图 ， 如 图 7.4(b) 
所 示 。 y 


























(b) 有 向 完全 图 
图 7.4 无 向 完全 图 和 有 向 完全 图 

性 质 2: 含有 n 个 顶点 的 无 向 完全 图 有 nX(n--1) 条 边 。 

证 明 : 任何 一 个 顶点 都 和 其 他 项 点 有 边 ， 则 这 样 的 边 有 n-1 条 ; KA n 个 具备 该 特征 
的 顶点 ， 因 此 有 mx (nz-1D 条 边 ， 图 中 无 重复 边 ， 因 此 不 用 除 以 2。 

也 可 以 得 到 结论 ， 对 于 具有 个 顶点 和 e 条 边 数 的 图 , 无 向 图 有 O<e<n(n-1)/2, 有 向 
RA 0<e<n(n-1). 

(8) F E(Spares graph): 有 很 少 条 边 或 弧 的 图 。 

稠密 图 (Dense graph): 相对 于 稀 疏 图 而 言 ， 有 很 多 条 边 或 弧 的 图 。 

(9) 权 (Weighb: 图 的 弧 或 边 上 具有 与 它 相 关 的 数字 。 

网 QNetwork): 带 权 的 图 。 图 中 的 权 表示 从 一 个 顶点 到 另 一 个 顶点 的 距离 或 耗费 。 图 7.5 
就 是 一 张 带 权 的 图 ， 即 标识 中 国 四 大 城市 的 直线 距离 的 网 ， 图 中 的 权 就 是 两 地 的 距离 。 
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图 7.5 城市 距离 的 网 图 
(10) 子 图 (Subgraph): 假设 有 两 个 图 GV, HAG=V, E), WEVCV, HECE, 
则 称 GA G 的 子 图 。 图 7.6 中 的 (b) 图 为 左 侧 无 向 图 和 有 向 图 的 fle 
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71.2 图 的 项 点 与 边 间 关 系 
1. 邻接 与 关联 
对 于 无 向 图 G=(V，E)， 如 果 边 (w，v')eEE， 则 称 顶 点 v 和 v' 互 为 邻接 点 (Adjacent),， 即 v 
和 v' 相 邻接 。 边 (wv，v') 依 附 于 顶点 v 和 vw， 或 者 说 边 (vw，v') 与 顶点 v 和 v 相 关联 。 
如 图 7.6(a) 的 无 向 图 ， 顶 点 4 与 8 互 为 邻接 点 ， 边 (4，B) 依 附 于 顶点 4 与 B 上 。 
对 于 有 向 图 G=(P E) WEIK, v>EE, WERA v 邻接 到 顶点 v， 顶 点 v' 邻 接 自 
顶点 v。 弧 <v，v 人 > 和 顶点 v，v' 相 关联 。 
如 图 7.6(a) 的 有 向 图 ， 顶 点 4 邻接 到 顶点 D， 顶 点 D 邻接 自 顶 点 4， 弧 <4，D> 和 顶点 
4、D 相关 联 。 
2. 顶点 的 度 
对 于 无 向 图 ， 顶 点 v 的 度 是 和 v 相关 联 的 边 的 数目 ， 记 做 TD(v)。 在 图 7.2(a) 的 无 向 图 
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中 , 顶点 vi 的 度 为 3, 顶点 v3 的 度 为 4, 该 图 的 边 数 是 8， 各 个 顶点 度 的 和 =3+3+4+3+3=16， 
以 得 知 边 数 其 实 就 是 各 顶点 度数 和 的 一 半 , 而 多 出 的 一 半 是 因为 每 条 边 都 重复 两 次 计数 。 
ik, e= FS TDW). 
对 于 有 向 图 , 顶点 v 的 度 TD(v) 分 为 出 度 和 入 度 两 部 分 。 以 顶点 v 为 头 的 弧 的 数目 称 为 
VINA, i IDO); 以 顶点 v 为 尾 的 弧 的 数目 称 为 v 的 出 度 ， 记 为 OD(v); 顶点 v AYRE 
为 TD(v)=ID(Y)+OD(v)。 
如 图 7.2(b) 所 示 ， 顶 点 vi 的 出 度 为 2( 从 vi 到 vw 的 弧 ， 从 vw 到 vi 的 弧 )， 入 度 为 1( 从 vw 
到 v 的 弧 )， 所 以 顶点 vi 的 度 为 2+1=3。 图 中 有 向 图 的 弧 有 四 条 ， 而 各 顶点 的 出 度 和 = 
2+0+IH1-4， 各 顶点 的 入 度 和 ~I+Itltl=4。 因 此 可 得 ，e= 六 IDO)= 立 op) ， 
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3， 路 径 K 


无 向 图 GV, EPAD me Vio Vi "Vim V) 其 
Pop vi) SB, jE, mp Bo, vio) Vio viy e Wow 分别 是 图 中 的 边 。 如 图 7.7 
中 ， 顶 点 8 到 顶点 D 有 四 种 不 同 的 路 径 。 




















a ta 无 向 图 的 顶点 aaa 的 四 种 路 径 


有 向 图 C 的 路 径 也 是 有 向 的 ， 顶点 请 rE vi>EE, jE[l, m] 在 图 7.8 中 
顶点 B8 到 顶点 ree -~ Pasanin. 


图 7.8 有 向 图 的 顶点 B 到 顶点 D 的 两 种 路 径 
树 的 根 节点 到 任意 节点 的 路 径 是 唯一 的 ， 而 图 中 两 个 顶点 之 间 的 路 径 不 是 唯一 的 。 
4. 路 径 长 度 


路 径 上 的 边 或 弧 的 数目 。 图 7.7 的 无 向 图 中 顶点 B 到 顶点 D 的 路 径 长 度 各 不 相同 ， 左 
边 两 条 路 径 长 度 为 2， 右边 两 条 路 径 长 度 为 3。 


5 回路、 简单 路 径 、 简 单 回路 


回路 : 也 称 环 (Cycle)， 指 第 一 个 顶点 和 最 后 一 个 项 点 相同 的 路 径 。 
简单 路 径 : 序列 中 顶点 不 重复 出 现 的 路 径 。 
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简单 回路 : 也 称 简单 环 ， 指 除了 第 一 个 顶点 和 最 后 一 个 顶点 外 ， 其 他 顶点 不 重复 出 现 
的 回路 。 
在 图 7.9 中 ， 左 边 的 回路 (v1,，v3，v4，w，vwi) 由 于 第 一 个 顶点 和 最 后 一 个 顶点 都 是 w， 
Hv, wa， 没有 重复 出 现 ， 因 此 是 一 个 简单 回路 。 而 右边 的 回路 (vi， v3, ve vo vo vib 
于 有 顶点 vs 的 重复 ， 就 不 再 是 简单 回路 。 















































7.1.3 ”连通 图 的 相关 术语 

































































1， 连 通 SS 

在 无 向 图 G 中 ， 如 果 从 顶点 v 到 顶点 也 aN HUA v 和 是 连通 的 。 

2. £08 KS 

如 果 对 于 TN i. 
Graph). 

如 图 710 所 示 ， 图 nasi. hens 但 是 与 顶点 或 无 路 
从 连通 ， mee OE A e 此 是 
连通 图 。 ee 

(a) 非 连通 图 (b) 连通 图 
图 7.10” 非 连通 图 和 连通 图 

3， 连 通 分 量 

连通 分 量 指 无 向 图 中 的 极 大 连通 子 图 。 连 通 分 量 要 求 满足 以 下 条 件 。 

(1) 要 求 是 子 图 。 


(2) 子 图 是 连通 的 。 

(3) 连通 子 图 含有 极 大 项 点数 ， 即 若 增 加 一 个 顶点 ， 则 其 不 是 连通 子 图 。 

(4) 具有 极 大 项 点 数 的 连通 子 图 包含 依附 于 这 些 顶 点 的 所 有 边 。 

如 图 7.11 所 示 ， 图 (a) 是 一 个 无 向 非 连通 图 ， 但 是 它 有 两 个 连通 分 量 ， 即 图 和 (c)。 而 
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图 (d) 尽 管 是 图 (a) 的 子 图 , 但 是 不 满足 连通 子 图 的 极 大 项 点 数 要 求 , 因此 不 是 图 (a) 的 连通 分 量 。 
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(a) AEEA (b) 连通 分 景 (一 ) (c) 连通 分 最 (二 ) (d) 下 连通 分 量 
图 7.11 连通 分 量 
4， 强 连通 图 
在 有 向 图 Gh, WRAFE— A v YE. vv M vE] v AIA vF] v HEERE, 
则 称 G 是 强 连 通 图 。 KOs 
5， 强 连通 分 量 N) 





强 连通 分 量 指 有 向 图 中 的 极 大 强 连 通 子 图 。 





6. 连通 











N Pa 
7 o Fear Xo (a) 的 强 连通 分 晤 
p i | *% x 
rS 7.42 Sain 
J 
成 树 


在 图 7.12 中 ， 图 (a) 不 是 强 连通 图 ， 因 为 顶点 Ne DD 存在 路 径 ， 而 D 到 4 不 存在 
路 径 。 图 (b) 是 强 连通 图 ， zi ， 即 图 (a) 的 强 连通 分 量 。 
KO 


连通 图 G 的 一 个 极 小 连通 子 图 , 包含 有 G 中 所 有 n 个 顶点 , 但 是 只 有 足以 构成 一 棵 树 


的 m1 条 边 。 


生成 树 有 以 下 三 个 要 素 。 
(1) G 中 的 全 部 个 项 点。 
(2) 图 为 连通 图 。 


(3) 只 有 六 
在 图 7.13 4 


1 条 边 。 








Ph，(a) 是 一 个 普通 图 ， 显 然 不 是 生成 树 ， 因 为 其 顶点 数 为 8， 而 边 数 为 9， 


当 去 掉 两 条 构成 环 的 边 后 , 如 图 (b), 图 (c) 所 示 , 就 满足 了 nn 个 顶点 n-1 条 边 且 连 通 的 定义 ， 
即 (b) 和 (ec) 都 是 生成 树 。 由 此 可 知 ， 如 果 一 个 图 中 有 个 顶点 和 小 于 n-1 RI, IS 
通 图 ， 如 果 它 多 于 n-1 条 边 ， 则 构成 一 个 环 ， 因 为 这 条 边 使 得 它 依附 的 两 个 顶点 间 有 了 第 
二 条 路 径 。 如 图 (b) 和 图 (c) 中 随便 在 哪 两 个 顶点 间 加 一 条 边 都 将 构成 环 。 但 是 有 n-1 条 边 并 
不 一 定 是 生成 树 ， 如 图 (d) 所 示 ， 因 为 图 (d) 不 是 连通 图 。 














其 是 非 连 


(a) 普通 图 (b) 生成 树 (一 ) (c) 生成 树 (二 ) (d) 非 生 成 树 
7.13 ”生成 树 
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7， 有 向 树 


若 有 向 图 只 有 一 个 顶点 的 入 度 为 0， 其 余 顶 点 的 入 度 均 为 1， 则 其 称 为 有 向 树 。 所 谓 的 入 
度 为 0 的 顶点 相当 于 树 中 的 根 节点 ， 其 他 入 度 为 1 的 顶点 是 指 树 的 非 根 节点 的 双亲 只 有 1 个 。 


8， 有 向 图 的 生成 森林 O 
有 向 图 的 生成 森林 是 指 由 若干 棵 有 向 树 组 成 ， ot 页 点 ， 但 只 有 足以 构成 若 











干 棵 不 相交 的 有 向 树 的 弧 。 
在 图 7.14 中 ， 图 (a) 是 一 个 有 向 图 ， AH aoi 以 分 解 成 两 棵 有 向 树 ， 如 图 (b) 
和 (c)， 这 两 棵 就 是 图 (有 向 图 的 生成 森林 。、A AN 



















tear (©) 有 向 树 (二 ) 


三” 7.1408 向 树 和 生成 森林 
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7.2 图 的 存储 结构 








信息 主要 有 项 点 信息 和 边 的 信息 两 部 分 ， 因 此 研究 图 的 存储 结构 主要 研究 这 两 部 
如 何在 计算 机 内 表示 。 
的 存储 结构 有 多 种 , 与 线性 表 和 树 相 比 更 加 复杂 , 其 中 最 常用 的 是 邻接 矩阵 和 邻接 表 。 


7.2.1 ”邻接 和 矩阵 存储 


图 的 邻接 矩阵 (Adjacency Matrix) 存 储 方式 就 是 用 两 个 数组 来 表示 图 。 一 个 一 维 数组 存 
储 图 中 顶点 信息 ， 一 个 二 维 数组 nXn 阶 和 矩阵 存储 图 中 的 边 或 弧 的 信息 ， 即 矩阵 元 素 aj 的 
值 表示 为 顶点 w( 行 ) 与 顶点 W 列 ) 间 的 关系 。 
设 图 G=V, EAA mn 三 D) 个 顶点 wm，vm，…，w， 和 普 条 边 或 弧 el1，e,，…，em， 则 
G 的 邻接 矩阵 是 nXn 阶 和 矩阵 ， 记 为 4(G)。 其 每 一 个 元 素 由 定义 如 下 。 

对 于 有 向 图 的 邻接 矩阵 来 说 ， 当 <v;，v> 是 该 有 向 图 中 的 一 条 弧 时 ，aj=1， 否 则 aj=0. 
第 i 个 顶点 的 出 度 为 矩 阵 中 第 i 行 中 “1” 的 个 数 ， 入 度 为 第 i 列 中 “1” 的 个 数 ， 并 且 有 向 
弧 的 条 数 等 于 矩阵 中 “1” 的 个 数 。 
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对 于 无 向 图 的 邻接 矩阵 来 说 ， 当 (vw， 功 是 该 无 向 图 中 的 一 条 边 时 ，ay=aj=1， 

a0。 第 1 个 顶点 的 度 为 拓 阵 中 第 1 行 中 “1” 的 个 数 或 第 1 列 中 “1” 的 个 数 。 图 

的 数目 等 于 矩阵 中 “1” 的 个 数 的 一 半 ， 因 为 每 条 边 在 矩阵 中 描述 了 两 次 ， 即 
顶点 w 与 w 相 邻接 

uf, 其 他 








对 于 有 权 值 的 网 图 来 说 ， 有 





fo Vil ssi vv A SE 
a -f 其 他 
图 7.2(a) 无 向 图 G 的 邻接 矩阵 如 图 7.15(a) 所 示 ， 图 7.2(b) 有 向 图 G MSR BEE 
图 7.15(b) 所 示 。 图 7.15(c) 所 示 的 权 网 G3 的 邻接 矩阵 如 图 7.15(d) 所 示 。 
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OF (c) 权 图 Gs (d) REG tts SEAT 
图 7.15 ”邻接 和 矩阵 


邻接 矩阵 具有 如 下 特征 。 

(1) 图 中 各 顶点 的 序号 确定 后 ， 图 的 邻接 矩阵 是 唯一 确定 的 。 

(2) 无 向 图 和 无 向 网 的 邻接 矩阵 是 一 个 对 称 矩 阵 ， 可 以 压缩 存储 其 下 三 角 和 矩阵 ， 
个 顶点 的 图 只 需 使 用 n(m+1)/2 个 存储 单元 ， 有 向 图 的 邻接 矩阵 不 一 定 对 称 ， 故 n 个 顶 
n EAE AT.» 
(3) 无 向 图 中 顶点 v FRE FE SB BAB BES i 行 (或 第 i 列 ) 的 非 0 元 素 的 个 数 。 
(4) 有 向 图 中 顶点 v 的 度 是 邻接 矩阵 中 第 i 行 与 第 i 列 非 0 元 素 个 数 之 和 。 
(5) 无 向 图 的 边 数 等 于 邻接 矩阵 中 非 0 元 素 个 数 之 和 的 一 半 ， 有 向 图 的 弧 数 等 于 
和 矩阵 中 非 0 元 素 之 和 。 

邻接 矩阵 表示 法 对 于 以 图 的 顶点 为 主 的 运算 比较 适用 。 此 外 ， 除 完全 图 外 ， 其 他 
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邻接 矩阵 如 果 有 许多 零 元 素 ， 特 别 是 稀疏 图 ， 当 n 值 较 大 ， 而 边 数 相对 很 少时 ， 采 
矩阵 存储 图 信息 就 会 浪费 存储 空间 。 
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建立 带 权 无 向 图 邻接 矩阵 的 算法 如 下 。 
假设 权 值 为 int 型 ， 每 个 顶点 存放 int 型 的 顶点 编号 ， 首 先 输入 图 的 顶点 数 和 边 数 ， 然 
后 输入 项 点 编号 来 建立 项 点 信息 表 ， 并 将 邻接 矩阵 中 的 各 元 素 初始 化 为 0 或 无 穷 大 数 ; 最 
后 按 项 点 顺序 输入 每 条 边 的 项 点 编号 和 权 值 ， 从 而 建立 图 的 邻接 矩阵 。 
算法 7.1 无 向 网 图 的 邻接 矩阵 的 创建 。 


#define MAXSIZE 100 /* 图 的 顶点 个 数 , 由 用 户 确定 */ 
typedef Char DataType; 

















typedef struct 


{ 
DataType vexs[MAXSIZE]; /* 顶 点 信息 表 */ 
int edges [MAXSIZE] [ MAXSIZE]; 1 * SB BENE BE / 
int numVexs,numEdges ; /* 顶 点 数 和 边 


}Graph; 


void Create Graph (Graph *G) Qs 
{ aw 


int i,j ,k,w; 
scanf ( “%d” ,&(G-> numVe -> numEdges)); /* 输 入 顶点 数 及 边 数 */ 
printf ee 7 建立 顶点 信息 表 :\n") ; 


for(i = 0;i< G -> m 
scanf ("%c",& s[i])); ko 
初 


for (i = 0;i< TO maton i++) 始 化 */ 
for gi = as os -> numVexs; 
on mage [j] = 0; i 
for oe f Fk< G -> numEdgës /* 读 入 边 的 顶点 编号 和 权 值 , 建立 邻接 矩阵 */ 


ax 人 ae 和 权 值 w: ", k+1); 
nf ("%d,%d,%d",&i,&j,&w); 


G ->edges[i] [j] = w; 
G ->edges[j] [i] = w; 


} 
该 算法 的 执行 时 间 是 Onn +e), He <n? , MARRIR REJ O(n") 。 





7.2.2 ”邻接 表 存储 
邻接 表 (Adjacency Lisb 是 图 的 一 种 链 式 分 配 的 存储 结构 。 在 邻接 表 表 示 法 中 ， 用 一 个 
顺序 存储 区 来 存储 图 中 各 项 点 的 数据 , 并 对 图 中 每 个 顶点 vi 建立 一 个 单 链表 ( 称 为 vi 的 邻接 





表 )， 把 顶点 vi 的 所 有 相 邻 项 点 ， 即 其 后 继 顶 点 的 序号 连接 起 来 。 

邻接 表 的 处 理 方法 如 下 。 

(1) 图 中 顶点 用 一 个 一 维 数组 存储 ， 另 外 ， 项 点 数组 中 的 每 个 数据 元 素 还 要 存储 指向 
第 一 个 邻接 点 的 指针 ， 以 便于 查找 该 顶点 的 边 信息 。 如 图 7.16(a) 所 示 , 顶点 数组 (或 顶点 表 ) 
中 的 每 个 节点 由 data 和 first 两 个 域 表 示 ， 其 中 ， 数 据 域 data 用 于 存储 顶点 的 信息 ， 指 针 域 
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first 用 于 指向 边 表 的 第 一 个 节点 ， 即 该 顶点 的 第 一 个 邻接 点 。 

(2) 图 中 每 个 顶点 v 的 所 有 邻接 点 构成 一 个 线性 表 ， 称 为 边 表 ， 由 于 邻接 点 个 数 不 一 
定 ， 因 此 用 单 链表 存储 。 如 图 7.16(b) 中 , 每 个 边 表 节 点 由 vertex 和 next 两 个 域 组 成 , 其 中 ， 
邻接 点 域 vertex 用 于 存储 顶点 v; 的 某 个 邻接 点 在 顶点 表 中 的 序号 (或 数组 下 标 ), 指针 域 next 
用 于 指向 下 一 个 边 表 节 点 。 


[aa [| 


(a) 顶点 表 结 点 (b) 边 表 结 点 
图 7.16 邻接 矩阵 表示 的 节点 结构 
此 ， 在 无 向 图 的 邻接 表 中 ， 顶 点 vi 的 每 个 边 表 节 点 都 对 应 于 与 vi 相关 联 的 一 条 边 ， 
将 该 邻接 表 称 为 边 表 ;而 在 有 向 图 的 邻接 表 中 ， 顶 点 ne: E PEELS 


尾 的 一 条 弧 ， 因 此 将 该 邻接 表 称 为 出 边 表 。 
如 图 7.17 所 示 的 无 向 图 G4， 其 顶点 vi 的 邻接 表 中 两 车 点 史 和 vw 在 顶点 表 中 的 


序号 (或 下 标 ) 分 别 为 1 和 2， 表示 关联 与 vi 的 边 有 两 a Ww) 和 (vl, v3)。 
FE data Vet vertex next 



















































































bag AS 
如 图 7.18. pass BED Gs 的 邻接 坊 中 :页 点 vw 的 邻接 表 中 有 两 个 边 表 节 点 ， 其 顶点 


序号 分 别 为 0 和 和 3》 表示 以 顶点 v WIEN AH Adi, vole, v> 
“FF data first vertex next 下 标 data firs verter next 
0) 4 
> | 
9 3 





ta) Fi Pa HG, (b) AGERET dc) HG WER 
图 7.18 有 向 图 Gs ABRAM HRT 
若 无 向 图 G 有 nn 个 顶点 、e 条 边 ， 则 邻接 表 需 个 顶点 表 节点 和 2e 个 边 表 节点 ， 每 
节点 有 两 个 域 。 显 然 ， 对 于 边 很 少 的 图 ， 用 邻接 表 比 用 邻接 矩阵 更 节省 存储 单元 。 
在 无 向 图 的 邻接 表 中 ， 第 i 个 边 表 中 的 节点 数 就 是 项 点 vi 的 度数 。 在 有 向 图 的 邻接 表 
中 ,第 i 个 边 表 中 的 节点 数 是 顶点 vi 的 出 度 。 若 要 求 v; 的 入 度 ， 则 必须 对 邻接 表 进行 遍历 ， 
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以 统计 顶点 的 值 为 i 的 边 表 节 点 的 数目 ， 这 样 做 很 费时 。 为 了 便于 确定 有 向 图 中 顶点 的 入 
度 ， 可 另外 建立 一 个 逆 邻 接 表 ， 将 顶点 v 的 每 个 边 表 节 点 对 应 于 以 vi 为 弧 头 的 一 条 统 ， 即 
边 表 节点 的 邻接 点 域 next 存储 邻接 到 v 的 顶点 的 序号 。 逆 邻接 表 的 边 表 称 为 入 边 表 。 如 
图 7.18(c) 所 示 即 为 有 向 图 Gs 的 逆 邻 接 表 表示 ， 顶 点 v3 的 入 边 表 中 有 一 个 边 表 节点 vo R 
示 以 V3 为 弧 头 的 弧 有 一 条 <vi， V3>。 

对 于 权 网 ， 则 只 需 在 边 表 节 点 的 结构 中 增设 一 个 权 值 域 weight 用 于 存放 权 值 信息 。 
邻接 表 与 邻接 矩阵 之 间 有 如 下 的 关系 。 

(1) 邻接 表 ( 或 道 邻 接 表 ) 表 示 中 ， 每 个 边 表 对 应 邻接 矩阵 的 一 行 (或 一 列 )。 

(2) 边 表 中 顶点 的 个 数 等 于 该 行 (或 列 ) 中 非 零 元 素 的 个 数 。 

(3) 邻接 表 中 的 每 个 节点 对 应 邻接 矩阵 中 该 行 的 一 个 非 零 元 素 。 

(4) 邻接 表 的 顶点 节点 对 应 邻接 矩阵 该 行 的 顶点 。 

邻接 表 存储 结构 类 型 定义 的 C 语言 表示 如 下 。 


#define NMAX 100 /* 假 设 顶点 Mw 100*/ 
typedef struct edgenode { JRE / 
int vertex ; 


struct edgenode *next ; 


} EdgeNode, *pointer; RY 


typedef struct { X> /* 顶 点 表 节 点 类 型 */ 


DataType data; 
EdgeNode ‘a /*i 


}HeadType; 


typedef Hip { 


aN e adlist[NMAX]; 
Sy numVexs,numEdges ; /* 图 中 当前 顶点 数 和 边 数 */ 
}LKGraph; 

建立 无 向 图 邻接 表 的 算法 如 下 。 

假设 每 个 顶点 存放 的 是 一 个 字符 ， 先 输入 表 头 数组 的 顶点 信息 data， 并 将 每 个 表 头 的 
first HY NULL: 然后 读 入 顶点 对 (i, 站)， 生 成 两 个 边 表 节 点 ， 其 vertex 域 分 别 置 为 i 和 jj 
再 将 它们 用 头 插入 法 分 别 插入 到 第 i 个 和 第 j 个 边 表 中 。 在 顶点 对 输入 过 程 中 , 自动 累计 边 
数 ， 若 输入 的 顶点 号 i<0， 则 结束 。 

算法 7.2 无 向 图 的 邻接 表 的 创建 。 


void CreatGraph (LKGraph *G) /* 建 立 无 向 图 的 邻接 表 */ 
{ int i,j,e,k;pointer p; 
printf (“请 输入 顶点 数 : \n” ); 


scanf (“%d”, &( G -> numVexs;)); 












































ay RTA SOL, 即 顶 点 表 */ 
wie 









































for (i =1; i<= G -> numVexs; i++) 
{RATE ELMAR 


scanf (“ \n $c”, &( G ->adlist [i]. data) ); 


Qe 


O 

© — E 
G ->adlist [i]. first = NULL; } 

e= 0; 

scanf ( “\n%d,%d\n”, &i,&j ); /* 读 入 一 个 顶点 对 号 工 和 */ 

while (i>0) 

{/* 读 入 顶点 对 号 ,建立 边 表 */ 
e++;_/* 黑 计 边 数 */ 





p-> vertex = j; 
p->next = G ->adlist[i]. first; 


ga->adlist[i].first = p; /* 将 新 表 节 点 插入 到 顶点 vi 的 边 表 的 头 部 */ 


p = (pointer)malloc(size(struct node)); A Ste/ 


p-> vertex = i; 
p->next = G ->adlist[j].first; 
G ->adlist[j].first=p; : 点 插入 到 顶点 vi 的 边 表 头 部 */ 


scanf ( “\ntd,%d\n”, &i,&j EAU iM */ 


} 
G -> numEdges = e ; “ys 
} 
NV > x 


PRET ey 即将 sr PBR CBU ABR, 
因为 对 于 无 向 图 来 说 ， 一 条 边 都 对 应 两 个 项 点 ， 因 让 在 循环 中 ， 一 次 要 对 ?和 /分 别 进行 插 
入 操作 。 Pa EF 
AE PARENTS REE OO e) 。 在 邻接 表 的 边 链表 中 ， 各 个 表 节 点 

J J = 
HORE AUER BLT aA DT p> 


73 图 的 遍历 

















与 树 的 遍历 类 似 ， 图 的 遍历 是 图 的 运算 中 最 重要 的 运算 ， 图 的 许多 运算 均 以 遍历 为 基 
础 ， 如 求 连通 分 量 、 求 最 小 生成 树 和 拓扑 排序 等 。 
从 图 中 某 个 顶点 出 发 访问 图 中 所 有 顶点 ， 且 使 得 每 个 顶点 仅 被 访问 一 次 ， 这 一 过 程 称 
为 图 的 遍历 。 根据 访问 路 径 方向 的 不 同 , 主要 有 两 种 遍历 图 的 方法 : 深度 优先 搜索 法 (Depth 
First Search，DFS) 和 广度 优先 搜索 法 (Breadth First Search, BFS). 
为 图 的 任 一 个 顶点 都 可 能 和 其 他 的 顶点 相 邻 接 ， 采 用 不 同 的 搜索 顺序 ， 可 能 出 现 同 
一 个 顶点 被 访问 多 次 的 情况 ， 因 此 ， 必 须 在 图 遍历 的 过 程 中 记 住 每 个 被 访问 过 的 顶点 ， 一 
般 可 以 设 一 个 数组 visited[i], WOMEN 0 或 “ 假 ” 表 示 该 顶点 未 被 访问 。 如 果 该 顶点 已 访 
问 过 ， 则 修改 visited[j] 的 值 为 1 或 “ 真 ”。 

书 中 算法 介绍 以 无 向 图 为 例 ， 但 是 算法 思想 和 实现 也 适用 于 有 向 图 。 





























7.3.1 深度 优先 搜索 遍历 


深度 优先 搜索 遍历 类 似 于 树 的 前 序 遍 历 ， 是 树 的 前 序 遍 历 的 推广 。 
PETN G ala te tb 在 G ee 个 顶点 v 作为 初始 出 














被 访 问 名 接点 出 发 进行 深度 优先 遍历， ER 中 所 有 和 v 有 了 全 相通 的 顶点 者 被 沪 问 到 ; 
若 此 时 图 中 尚 有 项 点 未 被 访问 ， 则 另 选 图 中 一 个 未 曾 被 访问 的 顶点 做 起 始点 ， 重 复 上 述 过 
程 ， 直 至 图 中 所 有 项 点 都 被 访问 到 。 

对 图 7.19 中 的 无 向 图 Go 进行 深度 优先 搜索 ， 有 具体 遍历 过 程 (以 下 标 小 的 顶点 优先 访问 
为 原则 ) 如 下 。 






































KK O 
N 无 向 图 Gs Bs 
(1) 从 起 始 顶 点 vy 出 发 H i 标记 为 已 访问 。 
(2) nies vse 按照 小 下 标 先 访 es 访问 邻接 顶点 vo HF ww 标记 
为 已 访问 n Ww 
(3) vti U Vis Yas vss Jen sw ， 因 此 访问 w， 将 内 标记 为 已 





访问 。 
(4) vs 有 两 个 邻接 点 ww、vs， 其 中 vw 为 已 访问 顶点 ， 因 此 访问 w， 将 vs 标记 为 已 访问 。 
(5) vs 有 两 个 邻接 点 ww、vs， 其 中 由 为 已 访问 顶点 ， 因 此 访问 vs， 将 vi 标记 为 已 访问 。 
(6) vs 有 两 个 邻接 点 vw,、v8， 均 为 已 访问 顶点 ， 因 此 退回 到 vs。 
(7) vs 的 两 个 邻接 点 均 为 已 访问 顶点 ， 因 此 退回 到 vw， 以 此 类 推 ， 一 直 退 回 到 vi。 
(8) u 有 两 个 邻接 点 v,、v3， 其 中 vw 已 经 访问 过 ， 因 此 访问 Vy， 将 标记 为 已 访问 。 
O) v3 有 两 个 邻接 点 ve、v7， 遵 从 小 下 标 开始 访问 原则 ， 访 问 ve， 将 ve 标记 为 已 访问 。 
(10) ve 有 两 个 邻接 点 v vo Ry 为 已 访问 顶点 ， 因 此 访问 vo 将 ww 标记 为 已 访问 。 
(11) ww 有 两 个 邻接 点 ve、v3， 均 为 已 访问 项 点， 因此 退回 到 ve 
(12) ve 的 两 个 邻接 点 均 为 已 访问 顶点， 因此 退回 到 v3， 以 此 类 推 ， 一 直 退 回 到 vi。 
至 此 ， 所 有 顶点 都 是 已 访问 项 点， 搜索 结束 。 由 此 得 到 的 顶点 搜索 序列 为 
viv Vg Vg V5 V3 Vg 7 
该 序列 称 为 DFS 序列 ， 一 个 图 的 DFS 序列 不 一 定 唯一 ， 这 与 算法 、 图 的 存储 结构 以 
及 初始 出 发 点 有 关 。 而 且 ， 由 具体 遍历 过 程 可 看 出 ， 深 度 优先 搜索 遍历 是 一 个 递归 过 程 ， 
其 特点 是 尽 可 能 地 先 对 纵深 方向 的 顶点 进行 访问 。 
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DFS 算法 的 步骤 如 下 。 

(1) 在 访问 图 中 某 一 起 始 顶 点 v 后 ， 由 v 出发， 访问 它 的 任 一 邻接 项 点 wi。 

2) 从 wi 出发， 访问 与 w 邻接 但 还 没有 访问 过 的 顶点 we. 

(3) 从 wa 出发， 进行 类 似 的 访问 …… 如 此 进行 下 去 ， 直 至 到 达 所 有 的 邻接 顶点 都 被 访 
问 过 的 顶点 u 为止。 

(4) 退回 一 步 ， 退 到 前 一 次 刚 访问 过 的 项 点， 看 是 否 还 有 其 他 没有 被 访问 的 邻接 顶点 。 

© 如 果 有 ， 则 访问 此 顶点， 之 后 从 此 顶点 出 发 ， 进 行 与 前 述 类 似 的 访问 ， 即 执行 步骤 (2)。 

@ 如 果 没 有 ， 则 再 退回 一 步 进行 搜 索 ， 即 执行 步骤 (4)。 

重复 上 述 过 程 ， 直 到 图 中 所 有 顶点 都 被 访问 过 为 止 。 

如 果 采 用 邻接 和 矩阵 来 存储 图 ， 则 深度 优先 搜索 算法 的 代码 实现 如 下 。 

算法 7.3 ”邻接 和 矩阵 的 深度 优先 遍历 递归 。 
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如 果 采 用 邻接 表 来 存储 图 ， 则 深度 优先 搜索 算法 的 代码 实现 如 下 : 
算法 7.4 ”邻接 表 的 深度 优先 遍历 递归 。 





BIBI BERD C ”) 


{int i; 
for (i=0;i<g->n;it+ ) 
visited[i] = 0; /* 初 始 所 有 项 点 状态 是 未 访问 状态 */ 


for (i= 0;i<g->n;i++) 
if (!visited[i]) 
DFSL(g,i); /* 对 未 访问 过 的 顶点 调用 DESL, 若是 连通 图 , 则 只 执行 一 次 */ 





} 
对 比 两 个 不 同 存储 结构 的 深度 优先 遍历 算法 ， 对 于 n 个 顶点 e ALR, BHE 
阵 由 于 是 二 维 数组 , 要 查找 每 个 顶点 的 邻接 点 需要 访问 矩阵 中 的 所 有 元 素 , 因此 需要 O(n?) 


的 时 间 。 而 邻接 表 做 存储 结构 时 ， 找 邻接 点 所 需 的 时 间 取 决 于 顶点 和 边 的 数量 ， 所 以 时 间 
复杂 度 是 O(n+e) 。 可 见 对 于 点 多 边 少 的 稀疏 图 来 说 ， 邻 接 表 结 构 使 得 算法 在 时 间 效率 上 





大 大 提高 了 。 从 
7.3.2 广度 优先 搜索 遍历 SS 

广度 优先 搜索 遍历 类 似 于 树 的 按 层次 遍历 。ii JG 态 是 所 有 顶点 均 未 访问 过 ， 在 
G 中 任 选 一 顶点 vi 为 初始 出 发 点 ， al 本 思想 是 : 首先 访问 出 发 点 v H 
次 访问 的 所 有 邻接 点 wo wo =e wp 访问 与 w，wa，…，w 邻接 的 所 有 未 曾 访 


此 时 ， 从 v 开 始 的 搜索 过 程 结 toe 

对 图 7.19 中 的 无 向 图 Gs 进行 上 优先 搜索 sae 起 始点 ， 则 有 具体 遍历 过 程 如 
下 : 访问 wm 的 两 个 邻接 点 von Ys， 接着 访问 va HY V4、Vs， 再 访问 的 两 个 邻接 
点 w、w， 继 续 访问 ve fle vs， 至 此 ， 所 PA 因此 ， 得 到 的 顶点 搜索 
序列 为 oe ee a i 

分 析 可 知 ; oe wi 在 顶点 “i 则 访问 wi 的 所 有 未 曾 访问 过 的 邻接 点 
之 后 , 再 访问 未 被 访问 的 相 邻 顶点 。 也 就 是 说 , 先 访问 的 顶点 其 邻接 点 亦 先 被 访问 ， 
penal: aby 因此 ， 可 以 引进 队列 保存 已 访问 过 的 顶点 。 

BFS 算法 的 步骤 如 下 。 

(1) 从 图 中 某 个 顶点 v 出 发 ， 访 问 此 顶点 。 

(2) 依次 访问 v 的 各 个 未 曾 访 问 的 邻接 点 。 

(3) 依次 从 这 些 邻 接点 出 发 再 依次 访问 它们 的 邻接 点 。 

(4) 直至 图 中 所 有 和 v 有 路 径 相 通 的 顶点 都 被 访问 为 止 。 

(5) 若 此 时 图 中 尚 有 顶点 未 被 访问 ， 则 另 选 图 中 一 个 未 曾 被 访问 的 顶点 做 起 始点 ， 重 
复 上 述 过 程 ， 直 至 图 中 所 有 顶点 都 被 访问 为 止 。 

如 果 采 用 邻接 矩阵 来 存储 图 ， 则 广度 优先 搜索 算法 的 代码 实现 如 下 。 

算法 7.5 ”邻接 矩阵 的 广度 优先 搜索 。 


问 过 的 顶点 ， 以 此 类 推 ， ne 1 发 点 v 有 路 径 相 通 的 顶点 都 已 访问 过 为 止 。 
通 





























void BFS (Graph *g,int v) / + FSI) EGRI HG * / 
{int je 
seqqueue q; /* 假 设 采用 顺序 队列 , 定义 顺序 队列 类 型 变量 / 


Initoueue (&q): /* 队 列 q 初始 化 */ 





O mr 
© =— 





printf ("访问 出 发 点 sd", v); /* 访 问 出 发 点 , 假设 为 输出 顶点 序号 */ 

visited[v] = 1; /* 置 访问 标志 为 1, 表示 此 顶点 已 访问 过 */ 

EnQueue (&q, v); /* 顶 点 v 入 q 队列 */ 

while (!QueueEmpty (&q)) /* 队 列 q 空 否 ?2*/ 

{ DeQueue(&q, &v); /* 队 列 gq 非 空 时 ,顶点 v 出 队 */ 

for(j= 1; j<=g-> n; j++) 
if(g->edges [v][j] = = 1 && !visited[j]) 

{ printf ("访问 顶点 $d",j); visited[j] = 1; /* 置 顶点 j 被 访问 标志 */ 
EnQueue (&q, j); /* 顶 点 j 入 队 */ 


} 
} 
} 


如 果 采 用 邻接 表 来 存储 图 ， i 
算法 7.6 邻接 表 的 广度 优先 搜索 算法 














void BFSL(Graph *g,int v) 人 构 , BES 遍历 */ 
{ SqQueue q; /* zr 定义 顺序 队列 类 型 变量 q*/ 
pointer p; 
TnitQueue (&q) ; “pe q or 
printf ("访问 出 发 点 a 问 出 发 点 , 假设 为 输出 顶点 序号 */ 
visited[v] = 1; Eo 表示 此 点 已 访问 过 */ 
EnQueue (&q, v); XC- Vian ( 刚 访 问 过 的 ) 入 队 */ 
while (!QueueEmp: /* 判 队列 
{ DeQueue (&q, a> ae 出 队 */ 
p = g->ad. [W] first; 头 指针 域 存 入 p 中 */ 
while PA a 
/* 访 问 与 与 顶点 v AIRE 有 项 点, 即 以 v 顶点 为 表 头 的 单 链表 */ 


{ 
Ne Pevieived [p->ve ue 
~ printf ("%d", p-> REEE visid[p-> vertex ]= 1; 


EnQueue (&q, p-> vertex); 


p = p->next; 


} 
对 于 具有 nn 个 节点 e 条 边 的 连通 图 , 因为 每 个 顶点 均 入 队 一 次 , 所 以 算法 BFS 和 BFSL 
的 外 循环 次 数 为 mn。 算法 BES 的 内 循环 是 n 次 , 故 算法 BFS 的 时 间 复 杂 度 O(n). 算法 BFSL 
的 内 循环 次 数 取决 于 各 顶点 的 边 表 节 点 个 数 , 内 循环 执行 的 总 次 数 是 边 表 节 点 的 总 个 数 2e， 
故 算法 BFSL 的 时 间 复 杂 度 是 O(n+e)。 算 法 BFS 和 BFSL 所 用 的 辅助 空间 是 队列 和 标志 数 
组 ， 故 它们 的 空间 复杂 度 为 O(n)。 
对 比 图 的 深度 优先 遍历 和 广度 优先 遍历 算法 ， 它 们 在 时 间 复 杂 度 上 相同 ， 不 同 之 处 仅 
在 于 其 对 顶点 访问 的 顺序 不 同 ， 可 见 两 者 在 全 图 遍历 上 没有 优 劣 之 分 ， 根 据 不 同情 况 选择 
不 同 算法 即 可 。 
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7.4 图 的 生成 树 


在 图 论 中 ， 常 常 将 树 定义 为 一 个 无 回路 连通 图 。 如 图 7.20 所 示 的 两 个 图 就 是 无 回路 的 
连通 图 。 尽 管 看 上 去 它们 不 是 树 ， 但 只 要 选 定 某 个 顶点 作为 根 ， 以 根 节点 为 起 点 对 每 条 边 
定向 ， 就 能 将 它们 变 为 通常 的 树 。 























图 7.20 两 个 无 回路 的 PN) 


根据 连通 图 生成 树 的 定义 (参考 7.1.3 节 ) 3 的 生成 树 是 G 的 极 小 连通 子 图 。 所 
谓 极 小 是 指 边 数 最 少 ， eS 就 会 使 之 变 为 非 连通 图 ， 若 在 生成 
树 上 任意 添加 一 条 边 ， 就 必定 出 现 回 

此 ， 生 成 树 具有 如 下 性 质 : tee ose 图 的 生成 树 有 且 仅 有 n-1 条 边 ， 
一 个 连通 图 的 生成 树 并 不 唯一 ?7 


A 
7.4.1 Won 4 My L 


对 给 ssp i oem Bs 

设 图 G= 十 -个 具有 个 项 >» 则 从 G 的 任 一 顶点 出 发 ， 对 G 进行 深 
度 优 先 搜索 或 户 度 优先 搜索 ， 可 以 访问 到 G 中 的 所 有 的 项 点 。 在 这 两 种 搜索 方法 中 ， 从 一 
个 已 访问 过 的 顶点 vi 搜索 到 一 个 未 曾 访问 过 的 邻接 点 yy, 必定 要 经 过 G 中 的 一 条 边 (vi, v) 
和 于 两 种 方法 对 图 中 的 n 个 顶点 都 仅 访问 一 次 ， 因 此 ， 除 初始 出 发 点 外 ， 对 其 余 n-1 个 顶 
点 的 访问 将 要 经 过 G 中 的 n-1 条 边 , 这 -1 条 边 把 G 中 的 个 顶点 连接 成 一 个 极 小 连通 子 
图 ， 从 而 得 到 G 的 一 棵 生成 树 。 

由 于 可 以 利用 图 的 遍历 算法 求 得 生成 树 ， 因 此 对 算法 DFSM( 或 DFSL) 做 调整 就 可 得 到 
深度 优先 生成 树 (DFS 生成 树 ) 的 算法 。 分 析 算 法 可 知 ， 当 DFSM(i) 递 归 调 用 DFSMO) 时 ，v 
是 已 访问 过 的 顶点 , vj 是 邻接 于 vi 的 、 未 曾 访 问 过 且 正 待 访 问 的 顶点 。 因此 ,只 需 在 DFSM 
SOE if 语句 中 ， 在 调用 语句 DFSM(j) 之 前 插入 适当 的 语句 ， 将 边 (v;，vw) 输 出 或 保存 起 来 
即 可 实现 。 

类 似 地 ， 在 算法 BFS( 或 BFSL) 中 ， 若 当前 出 队 的 元 素 是 w， 待 入 队 的 元 素 是 W v 
是 已 访问 过 的 顶点 ， 疼 是 待 访问 而 未 曾 访问 过 的 、 邻 接 于 vi 的 顶点 。 因 而 只 需 在 BFS 算法 
的 if 语句 中 插入 适当 语句 ， 即 可 得 到 求 广度 优先 生成 树 的 算法 。 例 如 ， 从 图 Gs 的 顶点 vi 
出 发 所 得 到 的 DFS 生成 树 和 BFS 生成 树 如 图 7.21 所 示 。 
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(a) DFS 生 成 树 (b) BFS 生 成 树 
图 7.21 图 Gs 的 DFS 和 BFS 生成 树 


上 面 给 出 的 生成 树 定义 ， 是 从 连通 图 的 观点 出 发 、 针 对 nae, 此 定义 不 仅仅 
适用 于 无 向 图 ， 对 有 向 图 同样 适用 。 若 G 是 强 连通 的 有 应 ee 顶点 v 出 发 
都 可 以 访问 遍 G 中 的 所 有 项 点 ， Ara An AS 。 区 别 在 于 ， 有 向 图 的 深度 优 
先生 成 树 和 广度 优先 生成 树 中 的 每 一 条 边 都 是 

若 G 是 非 连通 无 向 图 ， 则 要 多 次 调用 D (或 BRS) 算 法 ， 才 能 完成 对 G MIA. 因为 
每 ee led pa 量 的 顶点 集 ， 这 些 顶 点 和 遍历 时 所 经 过 的 
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边 构 成 了 该 连通 分 量 的 一 棵 DFS( 或 树 ， 而 G 的 各 个 连通 分 量 DFS( 或 BFS) 生 成 
树 组 成 了 G 的 DFS( 或 BFS) 生 成 森 似 地 ， 若 G 是 非 强 连通 的 有 向 图 ， 且 初始 出 发 点 
又 不 是 有 向 图 的 根 ， we poe a MAA, 

连通 图 的 生成 树 不 ， 因 为 从 不 同 的 顶点 进行 遍历 ， 可 以 得 到 不 同 的 生成 
树 。 如 果 连 通 图 G 是 一 个 ek 成 树 的 各 边 也 是 带 权 的 。 我 们 把 生成 树 
各 边 的 权 值 总 ROMER, SHEE i 最 小 的 生成 树 称 为 G 的 最 小 生成 树 (Minimun 
Spanning Tree) 
te OPE 
电信 实施 工程 师 需 要 为 一 个 镇 的 6 个 村 庄 架 设 通 信 网 络 做 设计 ，w 一 6 表示 村 庄 ， 之 间 的 
连 线 表示 村 与 村 之 间 的 可 通达 的 直线 距离 ， 如 vi 到 vw 是 16km， 无 连 线 表示 有 高 山 湖泊 而 
无 距离 数据 ， 如 图 7.22 所 示 。 屠 么 ， 如 何 用 最 小 的 成 本 完成 这 次 任务 ? 






































图 7.22 村庄 间 的 连接 图 


于 在 nn 个 城市 之 间 最 多 可 设立 的 线路 有 n(n-1)/2 条 ， 而 把 n 个 城市 连接 起 来 至 少 要 
有 n-1 条 线路 ， 而 且 在 每 两 个 城市 间 设 置 一 条 线路 ， 相 应 的 都 要 付出 一 定 的 经 济 代价 ， 所 























以 ， 问 题 归结 为 : 如 何在 n(n-1)/2 条 线路 中 选择 n-1 条 ， 使 得 总 耗费 (代价 ) 最 小 。 
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数据 结构 -语言 版) 《 )) _ 
— - Oo) 


此 ， 可 以 用 连通 网 来 表示 通信 线路 ， 顶 点 表示 n 个 城市 ， 边 表示 连接 两 个 城市 之 间 
的 线路 ， 设 置 边 的 权 值 表 示 两 个 城市 之 间 通 信 线 路 的 长 度 或 建造 代价 ， 则 对 n 个 顶点 的 连 
通 网 可 以 构造 出 许多 不 同 的 生成 树 ， 每 棵 生成 树 都 可 以 是 一 个 通信 网 ， 然 后 选择 一 棵 总 耗 
费 最 少 的 生成 树 (连通 网 的 最 小 代价 生成 树 )， 使 得 建立 的 通信 网 络 的 线路 的 总 长 度 最 短 或 
总 代价 最 小 ， 即 要 构造 该 图 的 一 棵 最 小 生成 树 。 

构造 最 小 生成 树 ， 要 解决 两 个 问题 : 尽 可 能 选取 权 值 小 的 边 ， 但 不 能 构成 
no] 条 恰当 的 边 以 连接 网 的 个 顶点 。 


7.4.2 ”最 小 生成 树 的 构造 


构造 最 小 生成 树 可 以 有 多 种 算法 ， 其 中 大 多 数 构造 算法 都 是 利用 了 最 小 生成 树 的 MST 
性 质 ， 设 G=(7， 司 是 一 个 连通 网 络 ， 避 是 顶点 集 V -ARTE Hu, yè G 中 所 有 
的 一 个 端点 在 U ED we UD)、 另 一 个 端点 不 在 U 里 ( 即 ve 庆功 的 边 中 ， 具 有 最 小 权 值 的 
条 边 ， 则 一 定 存在 G 的 一 标 最 小 生成 树 包括 此 边 (wx，y ERJ MST 性 质 。 
MST 性 质 可 用 反 证 法 证 明 De Ve it 
T 
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7 是 G 的 一 棵 最 小 生成 树 ， 但 不 包含 边 (u，v)。 由 于 ， 且 是 连通 的 ， 因 此 有 一 条 从 
到 v 的 路 径 ， 且 该 咯 从 上 必 有 一 条 连接 两 个 项 点破 由 和 -U HAC. vh SCH we Uv 
EV-U, BW u 和 vw 不 连通 。 当 把 边 (u， ee T 时 ， 得 到 一 个 含有 边 (w，v) 的 回路 ， 如 
图 7.23 R. WEA, v) ERE 消除 ， 由 此 得 到 一 棵 生成 树 7'，7' 和 7 的 区 
别 仅 在 于 用 边 (4，vw) 取 代 了 A KHA VIRU, VIR, iT WET 
的 权 ， 因此 7 也 是 G 的 最 小 生成 衬 ， CURU, v) =e 矛盾。 

A, ee bu 












































7.23 ”包含 边 (V，V-U) 的 回路 

找 连通 图 的 最 小 生成 树 , 经 典 的 有 两 种 算法 z 普 里 姆 (Prim) 算 法 和 克 鲁 斯 卡尔 (Kruskal) 

1， 普 里 姆 算法 

GV, 本 是 具有 个 顶点 的 连通 网 ， 顶 点 集 为 Vivo vo eo vye WIERE 
生成 树 为 T=(U, TE), HP U 是 最 小 生成 树 中 的 顶点 集 ，7TE 是 了 中 的 边 集 ， 并 将 G 中 
边 上 的 权 看 作 长 度 。 

Prim 算法 的 基本 思想 : 首先 从 严 中 任 取 一 个 顶点 (以 w 为 例 ),, 将 生成 树 了 置 为 仅 有 一 
个 节点 的 树 ， 即 置 入 选 顶点 集 U={w}， 此 时 入 选 边 集 Ti, BR 外 的 其 他 顶点 构成 待 
UUM V-U; 只 要 U 是 洲 的 真子 集 ， 就 在 所 有 的 其 一 个 端点 vw 已 在 NE we)、 另 一 个 
端点 vw 还 未 在 NE we 六 UU) 的 边 中 ， 找 一 条 最 短 ( 即 权 最 小 ) 的 边 (w，vw)， 并 把 该 条 边 (v;， 
切 并 入 了 的 边 集 TE， 相 应 的 顶点 y 加 入 入 选项 点 集 U。 重 复 以 上 过 程 ， 每 次 往生 成 树 里 
并 入 一 个 顶点 和 一 条 边 ， 直 至 入 选项 点 集 U 包含 了 所 有 的 顶点 ， 即 U=V， 而 入 选 边 集 TE 
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中 有 n1 条 边 。MST 性 质保 证 上 述 过 程 求 得 的 7=(Q，7B) 是 G 的 一 颗 最 小 生成 树 。 

显然 ，Prim 算法 的 关键 是 如 何 找到 连接 U Al VU 的 最 短 边 来 扩充 生成 树 7。 简单 的 方 
法 就 是 在 实施 算法 之 前 ， 将 所 有 边 进行 排序 ， 构 造 一 个 较 小 的 候选 边 集合 ， 且 保证 最 短 边 
属于 该 候选 集 ， 并 且 在 每 次 找到 一 条 最 短 边 加 入 到 入 选 边 集 TE 时， 调整 待 选 边 集合 。 
图 7.24 所 示 为 用 Prim 算法 找到 的 一 棵 最 小 生成 树 的 过 程 。 
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(e) US{vi Var RNJ (f) wm Vss Vas Vss ve} 
S724 Prim 算法 构造 时 ree 
为 实现 这 个 算法 ， 连通 ee 在 的 边 ， 相 应 的 矩阵 元 素 用 m 表 


示 ， 实 际 编码 可 以 去 计算 允许 的 最 大 值 存储 i 的 存储 结构 如 下 。 
type: eee WA Ye 
nÀ 6nd; /* 最 短 边 的 终点 , 起 点 是 候选 点 自身 */ 
int len; /* 边 长 ,这 里 假设 为 整数 */ 
}minedge [max+1]; /*max 是 图 中 顶点 数 的 最 大 值 */ 
Prim 算法 的 代码 描述 如 下 。 


算法 7.7 Prim 算法 。 


void Prim(Graph *g,int u) 
{ int v,k;j: min; 
for (v =1; v<=g->n; v++) 
if(v ! = u) 
{minedge[v] .end=u; 
minedge[v].len = g->edges[v] [u]: 
} 
minedge[u].len = 0; 
for( k = 1; k< g->n;k++) 
{min = minedge[k] .len; 
Mak; 


数据 结构 (- 语言 版) ©) 


for(j =1; j<g->n; j++) 
if (minedge[j] . len>0&&minedge [j] . len<min) 
{min = minedge[j].len; 
v=): 

4 
if (min=INTMAX) 

{ printf ( "图 不 连通 ,无 生成 树 !") 

return (0); 

} 

printf("$d %d” ,v, minedge[v] .end); 





minedge[v].len = -minedge[v] .len; 
for (j=1;4<=g->n; j++) 
if(g-> edges [j] [v]<minedge[j] .len) 


{minedge[j].len = g-> edges [j] [vl]; Rs 
minedge[j].end = v; 人 
oe 

red} 


poppe O(n’), 与 边 数 无 关 ， 因此 比较 适合 
E E 下 使 用 

2. 克 重 斯 卡尔 算法 ~ 

设 G=(V, PEEB > AE a ae ease 个 顶点 而 无 边 的 非 连通 图 
T=, $) ke Seidel 按照 增 的 顺序 依次 选择 5 中 的 边 (u， 
v) ADM A Ade resi Tama 思 、 丈 中 的 顶点 ， 则 将 该 边 加 入 到 了 
H, Ty 和 丈 也 由 此 边 连接 成 一 个 连通 分 量 ata v 是 当前 同一 个 连通 分 量 中 的 顶点 ， 则 
eae ge 棵 树 ， 此 边 添加 到 树 中 将 形成 回路 )。 以 此 类 推 ， 直 到 了 
中 所 有 顶点 都 在 同一 连通 分 量 上 为 止 ，7 便 是 G 的 一 棵 最 小 生成 树 。 

对 图 7.24(a) 中 的 连通 网 络 ， 按 Kruskal 算法 构造 最 小 生成 树 ， 其 过 程 如 图 7.25 所 示 。 
将 边 按 长 度 进行 排序 (vi，vw)，(va， v) W vs V vo ws va) wo v) (Vir va) vo 
v) Vo vs) Vs va) 后， 依次 选取 长 度 最 短 ， 且 又 都 连通 两 个 不 同 的 连通 分 量 的 边 (vi，v3)， 
(v2，vs)，(v4，ve)， 将 它们 添加 到 7 中， 如 图 7.24(a) 一 (c) 所 示 ; 考虑 当前 最 短 边 (v3，ve)， 
因为 边 的 两 端 在 不 同 的 连通 分 量 上 ， 因 此 加 入 7， 如 图 7.24(d) 所 示 ; 选取 边 (v3，vw)， 因 为 
该 边 的 两 个 端点 在 同一 个 连通 分 量 上 , 若 将 其 加 入 到 了 中 , 将 会 出 现 回路 ， 故 舍 去 这 条 边 ; 
EH, KA ARTH, RRA, v) 便 得 到 如 图 7.25(e) 所 示 的 单个 连通 分 量 7， 
它 就 是 所 求 的 一 颗 最 小 生成 树 。 

实现 这 个 算法 要 解决 两 个 问题 : 采用 什么 样 的 存储 结构 ， 如 何 判断 所 选 的 边 加 入 最 小 
生成 树 后 不 产生 回路 。 由 于 算法 的 每 一 步 都 是 选择 一 条 当前 权 值 最 小 的 且 不 会 形成 回路 的 
边 加 入 到 最 小 生成 树 的 边 集 中 ， 因 此 中 间 过 程 一 般 会 成 森林 。 随 着 算法 的 进行 ， 森 林 中 的 
树 将 逐步 连通 (合并 ) 成 一 棵 树 ， 即 所 求 的 最 小 生成 树 。 因 此 ，Kruskal 算法 的 基本 思想 是 按 
边 权 递 增 的 次 序 连 通 森林 。 
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图 7.25 Kruskal mana i 
Kruskal 算法 的 粗略 描述 如 下 sO 








> 
数据 结构 (C 语言 版 ) 各 ) 


if (em [i-1].len<min) { min = em [i-1] .len;j=i-1;} 
return j; 
i 
void Kruskal(EdgeType em [ ],int n,int e) /*n 为 节点 数 ,e 为 边 数 */ 
{int i,pl,p2,m, i0; 
for (i=1;i<= n;i++) /* 初 始 节点 为 根 ,无 双亲 */ 
parent[i ] = -1; /* 用 于 累计 节点 个 数 , 此 初 值 不 能 置 为 0*/ 
m= 1 
while(m< n) /* 获 取 最 短 边 ,合并 两 棵 树 , 共 获 取 n-1 条 最 短 边 得 到 一 棵 生成 树 */ 
{i0 = GetEdge (em,e); /* 获 得 最 短 边 号 ,此 号 是 所 求 边 在 数组 em 中 的 位 置 */ 
P1= GetRoot (em [i0] .v1) ; /* 获 得 最 短 边 的 两 个 顶点 号 , 并 求 得 两 项 点 所 在 树 的 根 pl 和 p2*/ 
p2= GetRoot (em [i0] .v2); y 
if(pl= = p2)continue; /* 若 连通 分 量 相同 , 则 不 合并 */ 
if( parent [p1] >parent [p2] ) /*parent [pi]; rent [p2] 这 时 为 负 ， 


根 无 双亲 */ 
{parent [p2] = parent [p1] 十 Parent soje 
parent[pl]= p2; } 


else {parent [ pl]= parent [p1] + KS parent[p2]= pl; } 
printf ( “%d%d%d\n” mms [i0] .v2 ); /* 输 出 第 m 条 最 短 边 */ 
mtt; 下 一 条 最 短 边 , 共 找 n-1 条 */ 
) Sev = 
NX ~A x. 
用 Kruskal 算法 构造 aL EO LAR Ot, 与 网 中 边 的 数目 有 关 ， 因 此 适 
合 于 求 稀 琉 图 的 最 小 生成 料 = 
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NO 75 最 短路 径 


交通 网 络 中 往往 需要 解决 如 下 的 问题 ， 两 地 之 间 是 否 有 通路 ? 如果 有 多 条 通路 ， 则 如 
何 确定 哪 一 条 是 最 短 的 ? 如 果 将 该 交通 网 络 用 带 权 图 来 表示 ， 则 图 中 顶点 表示 城镇 ， 边 表 
示 两 个 城镇 之 间 的 道路 ， 边 上 权 值 表示 两 城镇 间 的 距离 、 交 通 费用 或 途中 所 需 的 时 间 等 信 
息 。 上 述 提出 的 问题 就 是 在 带 权 图 (网 ) 中 求 最 短路 径 的 问题 ， 即 两 个 顶点 间 长 度 最 短 的 路 
径 。“ 最 短 ” 的 具体 含义 取决 于 边 上 权 值 所 代表 的 意义 。 对 于 对 非 网 图 来 说 ， 所 谓 的 最 短路 
径 指 的 是 两 顶点 间 经 过 的 边 数 总 和 最 小 的 路 径 ， 因 为 图 中 的 边 上 无 权 值 ， 而 网 图 的 最 短路 
径 ， 是 指 两 顶点 之 间 经 过 的 边 上 权 值 之 和 最 小 的 路 径 ， 并 且 称 路 径 上 的 第 一 个 顶点 是 源 点 
(Source)， 最 后 一 个 顶点 为 终点 (Destnation)。 

现实 中 两 地 间 的 路 径 往往 是 有 向 的 ， 如 4 城 到 B 城 有 一 条 公路 ,而 且 4 城 的 海拔 高 于 
B8 城 , 若 考 虑 到 上 坡 和 下 坡 的 车 速 不 同 ， 则 边 <4，B> 和 边 <B，4> 上 表示 行驶 时 间 的 权 值 也 
将 不 同 ， 也 就 是 说 <4，B> 和 <B，4> 应 该 是 两 条 不 同 的 边 。 考 虑 到 交通 网 络 的 这 种 有 向 性 ， 
本 节 将 只 讨论 有 向 网 的 最 短路 径 问 题 。 为 了 方便 讨论 ， 设 顶点 集 大 {1，2，…，n}， 并 假 
定 所 有 边 上 的 权 值 均 为 表示 长 度 的 非 负 实数 。 

































































7.5.1 ， 单 源 最 短路 径 


单 源 最 短路 径 问题 是 指 对 于 给 定 的 有 向 网 GV, EREDA v, 求 从 v 到 G 的 其 余 
各 个 顶点 的 最 短路 径 。 

如 果 用 图 7.26 所 示 的 有 向 网 G7 表示 五 个 城市 间 的 航线 图 ， 顶 点 表示 不 同 的 城市 ， 弧 
上 的 权 值 表示 运输 费用 ， 则 求 城市 1 到 其 他 各 城市 的 最 小 运输 费用 , 实际 上 就 是 求 G7 中 项 
点 的 最 短路 径 问 题 。 
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图 7.26 有 向 网 Gy = 


从 有 向 网 Gy 可 以 看 出 ， 顶 点 1 到 其 他 各 顶点 
1 到 2 的 路 径 有 一 条 : 1 一 2(10)， gh 径 长 度 ， 即 路 径 上 的 权 值 之 和 。 
50)。 


1 到 3 的 路 径 有 两 条 : 1 一 2 一 3(60), . i 

1 到 4 的 路 径 有 一 条 : 1 一 4(30)。 

1 到 5 的 路 径 有 四 条 : 1 一 5(1 Cn 1 -235(70), 1—4—3—5(60), 
分 别 选 出 1 到 其 他 各 项 点 的 下 Rie, a Ton 得 到 : 1+2(10), 
1+4(30), 1--4-+3(50),. 1-4-3 5(60). 

观察 上 面 的 序列 ， 互 可 以 发 现 规律 ， 若 按 长 So eas v 到 其 他 顶点 的 最 
短路 径 ， 则 当前 正在 的 最 短路 径 上 除 终点 以 外 ， 其 余 项 点 的 最 短路 径 均 已 形成 。 将 源 
点 的 最 短路 和 成 的 源 点 到 其 自 KENO 的 路 径 。 如 图 7.26 中 ， 若 当前 正在 生 
成 的 是 顶点 3 的 最 短路 径 ， 则 该 路 径 1 一 4 一 3 上 顶点 1 和 4 的 最 短路 径 在 此 以 前 已 生成 ， 
因为 它们 的 最 短路 径 长 度 比 顶点 3 的 最 短路 径 长 度 要 小 。 

迪 杰 斯 特 拉 (Dijkstra) 算 法 正 是 基于 上 述 规律 而 设计 的 ， 其 算法 使 用 了 贪心 (局 部 最 优 ) 
策略 ， 按 路 径 长 度 递增 的 次 序 产生 各 顶点 的 最 短路 径 ， 即 利用 局 部 最 优 来 计算 全 局 最 优 。 
算法 的 基本 思想 : 设置 两 个 顶点 集 8 和 T, S 中 存放 已 经 确定 的 最 短 的 路 径 的 顶点 ，7 中 存 
放 待 确定 最 短路 径 的 顶点 ， 初 始 状态 时 ，$ 中 只 有 一 个 源 点 v，7 中 包含 除 源 点 外 的 其 他 顶 
点 ， 而 各 顶点 当前 的 最 短路 径 长 度 为 源 点 v 到 该 顶点 的 弧 上 的 权 值 ， 如 果 没 有 源 点 到 该 项 
点 的 直接 可 达 路 径 ， 则 路 径 长 度 为 无 穷 大 ,选取 了 中 当前 最 短路 径 长 度 最 小 的 一 个 顶点 v 
加 入 到 $ 中 ， 然 后 修改 了 中 剩余 顶点 的 当前 最 短路 径 长 度 ， 修 改 原 则 是 当 项 点 v 的 最 短路 
径 长 度 与 v 到 了 中 各 顶点 间 的 权 值 之 和 小 于 该 顶点 的 当前 最 短路 径 长 度 时 ， 用 前 者 的 值 代 
Hat, 重复 上 述 过 程 ， 直 到 $ 中 包含 所 有 的 顶点 为 止 。 

图 7.27 给 出 了 有 向 网 中 的 顶点 1 到 其 他 各 顶点 的 最 短路 径 的 过 程 ， 图 中 实 线圈 和 虚线 
圈 分 别 表示 已 确定 和 未 确定 最 短路 径 的 项 点， 实 线 表示 已 确定 了 的 最 短路 径 上 的 弧 ， 虚 线 


表示 有 可 达 路 径 ， 但 是 未 确定 最 短路 径 的 弧 。 
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图 7.27 用 Dijkstra 算法 求 最 短路 : Axe 
下 面 用 实例 对 该 算法 过 程 进行 介绍 。 AS 
Kooma. 
12 3 4 





如 图 7.28 所 示 ， 求 有 向 网 Gs 中 的 顶点 w 到 
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(1) 假设 集合 人 是 G 的 顶点 集 ，$8 是 已 找到 最 短路 径 的 顶点 集 ，7 是 待 确定 最 短路 径 
的 顶点 集 ， 则 初始 状态 时 ，S= fj， 六 fw，m，wm，，w}。 以 后 陆续 将 已 求 得 的 最 短路 
径 的 顶点 加 入 到 5s 中 ,并 在 7 中 删除 掉 该 项 点 。 当 所 有 顶点 都 进入 集合 S 时 ， 则 算法 结束 。 
用 一 维 数组 表示 集合 ， 如 果 顶 点 vw 加 入 到 集合 内 ， 则 对 应 数组 值 为 S[] 为 1， 否则 为 0。 

(2) 将 有 向 图 用 邻接 矩阵 表示 ， 即 用 权 值 代 替 邻 接 矩 阵 中 原来 的 1， 若 顶点 间 无 边 则 上 
c 表 示 。 

(3) 用 数组 Path 卜 存放 顶点 最 短路 径 上 该 点 的 前 趋 顶点 ,通过 它 可 以 找到 路 径 上 每 个 顶 
点 的 前 趋 ， 从 而 得 到 最 短路 径 。 

(4) 用 一 维 数组 Disc[] 存 放 各 顶点 的 最 短路 径 长 度 ， 则 Disc[i] 表 示 源 点 vo 到 某 个 顶点 
vi 的 当前 最 短路 径 的 长 度 ， 如 果 vo 到 vi 无 通路 ， 则 Disc[i]=%。 每 当 有 一 个 顶点 进入 集合 5 
时 ,都 要 调整 该 数组 中 的 最 短路 径 值 (在 顶点 v; 加 入 到 S 中 前 ,相应 的 Disc[i] 都 是 中 间 结 果 )， 
当 最 后 一 个 顶点 进入 集合 8 以 后 ， 修 改 完 Disc 中 的 值 ， 即 可 得 到 源 点 到 其 他 所 有 顶点 的 最 
短路 径 。 

算法 具体 过 程 步 又 如 下 。 

(1) 初始 ，Disc 思 的 值 为 w 到 vi 的 弧 的 权 值 。 
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Vo 到 顶点 w、v4a、vs 的 权 值 分 别 为 10，30，100， 而 到 其 他 顶点 没有 可 达 通 路 ， 因 此 取 
最 小 值 10， 即 Disc[2]=10 便 是 vo 到 vw 的 最 短路 径 的 长 度 ，Path[2]=(vo)。 

(2) 寻找 下 一 条 最 短路 径 。 设 下 一 条 最 短路 径 的 终点 是 yy， 则 这 条 最 短路 径 或 者 是 (vo， 
VBE vy BAIL vy BIA vj PRE. STATA, vo 和 vs, v 直接 连通 ， 而 且 经 过 vw 可 达 v 
路 径 长 度 分 别 为 100、30、10+50=60， 其 中 的 最 小 值 为 30， 即 D[4]=30 便 是 w 到 内 的 最 短 
路 径 的 长 度 ，Path[4]=(vo)。 

(3) 继续 寻找 下 一 条 最 短路 径 。 设 下 一 条 最 短路 径 的 终点 是 w， 则 这 条 最 短路 径 或 者 
Evo vw) REE w 经 过 vw 或 ww 到 达 vi 的 路 径 。 分 析 可 得 ，vo 直接 可 达 vs， 经 过 v ik 
v3, ZEW vg WIE v3 和 vs， 路 径 长 度 分 别 为 100、10+50=60、30+20=50、30+60=90， 最 小 值 
为 50， 即 D[3]=50 便 是 vo 到 vw; 的 最 短路 径 的 长 度 ，Path[3]=(w)。 

以 此 类 推 ， 求 出 到 所 有 顶点 的 最 短路 径 。 





表 7.1 Dijkstra 算法 中 各 项 点 路 径 变 化 





























每 一 次 的 路 径 长 度 调 整 都 涉及 两 个 操作 : 选择 S 为 0 的 顶点 中 路 径 长 度 最 短 的 那个 顶 
点 vw 将 其 $ 值 设置 为 1， 然后 调整 8 仍 为 0 的 所 有 项 点 的 当前 最 短路 径 长 度 。 
最 终 得 到 的 vo 到 各 顶点 的 最 短路 径 及 长 度 加 表 7.2 所 示 。 








数据 结构 (C 语言 版 ) 


表 7.2 有 向 网 Gs 中 w 到 各 顶点 的 最 短路 径 和 路 径 长 度 
最 短路 径 























根据 上 述 分 析 ， 假 设 用 带 权 的 邻接 矩阵 arcs[ 四 [来 表示 带 权 有 向 图 ， 则 迪 杰 斯 特 拉 算 


法 可 描述 如 下 。 
(1) 初始 ，Disc[ 四 存放 w 一 各 顶点 





的 弧 的 权 值 ，Disc[i]=arcs[0][i]，S={}。 

















) 重复 执行 n-1 遍 ， 每 遍 求 出 一 条 新 的 最 短路 径 。 
© 利用 公式 DDj]=Min{D[i]lvEV-5} 得 到 一 条 新 的 从 vo 出 发 的 最 短路 径 及 新 的 终点 v 
4 S-S+H{v}。 
@ 利用 六 修改 从 w 出 发 到 集合 V-S 中 任 一 顶点 由 可 达 路 径 的 长 度 : DI] + arcs[j][k] 
45 D[k]. 


代码 实现 如 下 


算法 7. 


voi 


{ 





9 Dijkstra 算法 。 


d Dijkstra (Graph *g inE vInt *dist,int _*path, char *s) 


wx 党 站 


int i,j,k cle ymin’; 


AT die x 494+) Vw ‘kg 
ics = 0; / /初始 集合 s AB 


ay ae = g- >adges ASAT 
‘yet v; 


SLY] = Ly 
dist[v] = 0; 


for (i=1;i<g->n; i++) 


{ 
min=INTMAX; 
for (j=1;j<g->n; j++) 
if (!s[j]&&dist[j]< min ) 
{ 
min=dist[j]; 
k=j; 
} 
if (min = = INTMAX) break; 
s[k]=1; // 将 当前 找到 的 到 源 点 v 距离 最 小 的 顶点 k 并 入 s 


for (j=1;j<=g->n;j++) 
if (!s[j] &&dist[j]>dist [k]+g->adges[k] [j]) 


dist[j]=dist[k]+g->adges[k] [j]; 
path[j]=k; ”// 顶 点 j 的 前 趋 是 顶点 k 
} 
} 
for (i=1;i<= g->n;i++) 
{ 


if (dist[i]= =INTMAX) 
{printf (" 无 路 径 \n") ; continue; } 
printf ("顶点 $d 到 源 点 的 最 短路 径 长 :%d\n",i,dist [i] ); 
pre=path[i]; 
do 


i 
printf ("<- %d", pre); K ; 


pre = path[pre]; 


} while (pre! = v); as 
cis 


} 


7.5.2 所 有 顶点 对 间 的 最 短路 径 、、、、 


i PIs 
KR Te 2 “ln TA, SRLS 





Rn: yoru) hy 
AHO AA ER: KERALA AE, MUR 
拉 算 法 n Ue, BURR AMEN ZORA. MATERA SEEM, P 
TAIR, MENRE EEA IN TEI SL Ae EA O(n) 未 小 节 要 介绍 另 一 个 更 为 直接 和 简洁 的 角 
一 问题 的 算法 亡 是 由 弗 洛 伊 德 Floyd) 提 出 的 ， 其 执行 时 间 也 是 00). 

Floyd 算法 求 各 顶点 问 的 最 短路 径 长 度 的 基本 思想 如 下 。 

算法 采用 邻接 矩阵 edges 存储 带 权 有 向 网 ， 有 向 网 中 的 n 个 顶点 从 vo 开始 编号， 





点 到 的 最 短路 径 长 度 edges[i] 思 就 是 弧 <v;，vw> 所 对 应 的 权 值 。 当 弧 <v;，vw> 不 存在 时 ， 





edges[ 中 = 中 ; 当 v=vw 时 ，edges[ 中 =0， 即 对 角 线 上 的 元 素 为 0。 

为 了 便于 理解 ， 先 从 直观 上 进行 分 析 。 对 于 0<i, jnl, H vi yA, WA 
站 存在 一 条 长 度 为 edges 四 中 的 路 径 。 但 它 不 一 定 是 从 vi 到 vj 的 最 短路 径 ， 因 为 可 能 存 
条 从 vi 到 vw， 但 包含 其 他 顶点 为 中 间 点 的 路 径 。 因 此 ， 应 该 依次 考虑 vi 到 vw 能 否 有 以 
vo Vis e Vine APEA SEH BR AE 

(1) BBM vB vy EAA ATA vo IPAE: vo vo vyp WEE G 中 是 否 
<vo ve> 和 <vo，v>， 若 有 ， 则 新 路 径 vin vor vy MIKE edges[i][0]# edges[0] 中 之 和 
较 路 径 yy、v 和 vi;、vo、v 的 长 度 ， 并 以 较 短 者 为 当前 所 求 得 的 最 短路 径 。 该 路 径 是 中 
序号 不 大 于 0 的 最 短路 径 。 

(2) 考虑 从 六 到 六 是 否 有 包含 顶点 wm 为 中 间 的 路 径 : vo te vo te vy AA 
从 六 到 六 的 当前 最 短路 径 仍然 是 步骤 (1D) 中 求 出 的 , 即 从 六 到 六 的 中 间 点 序号 不 大 于 0 
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BRIBE BERD C ”) 


HRE: 车 有 ， 则 ww，…，w，…， 少 可 分 解 为 两 条 路 径 Ww，…，vi 和 vo = vy TAR 
条 路 径 是 前 一 次 找到 的 中 间 点 序号 不 大 于 0 的 最 短路 径 , 将 这 两 条 路 径 长 度 (已 在 前 一 次 中 
求 出 ) 相 加 就 得 到 路 径 vy，-…，vi，…， 久 的 长 度 ， 将 该 长 度 与 前 一 次 中 求 出 的 从 vP v h 
中 间 点 序号 不 大 于 1 的 最 短路 径 长 度 做 比较 ， 取 其 较 短 者 作为 当前 求 得 的 从 到 vy 的 中 间 
点 序号 不 大 于 1 的 最 短路 径 。 

G) 选择 顶点 凡 加 入 当前 求 得 的 从 到 六 中 间 点 序号 不 大 于 2 的 最 短路 径 中 ， 按 上 述 步 
又 进 行 比较 , 从 未 加 入 顶点 ww 作为 中 间 点 的 最 短路 径 和 加 入 顶点 作为 中 间 点 的 新 路 径 中 先 
取 较 小 者 ， 作 为 当前 求 得 的 从 v 到 的 中 间 点 序号 不 大 于 2 的 最 短路 径 。 以 此 类 推 ， 直 至 考 
虑 了 顶点 wi 加 入 当前 从 到 v 的 最 短路 径 后 ， 选 出 从 到 久 的 中 间 点 序号 不 大 于 n-1 的 最 
短路 径 为 止 。 由 于 G 中 顶点 序号 不 大 于 -1， 所 以 从 vw 到 的 中 间 点 序号 不 大 于 n-1 的 最 短 
路 径 ， 已 考虑 了 所 有 项 点 作为 中 间 点 的 可 能 性 ， 因 而 它 必然 是 从 到 v 的 最 短路 径 。 

为 了 更 直观 地 理解 Floyd 算法 的 原理 ， 下 面 来 分 析 一 个 最 A= TLE, 


如 图 7.29 所 示 。 
vo vi vz dme morn 10112] 
HE 


D' vwy v RSs D’ v u “ 
vlo 2 1 Yo 

205 A 2 0 F 
1 X 1 3/0 
& Map’ [LUDI=D te Dou" 


Vo Vi V2 


i ; s 012 

vi 010 

OO; ~ v ; X , vf 0 072 
DA 所 以 P RIEP "to" 


NY 
J 
NG 图 7.29 三 个 项 点 连通 网 的 Floyd 算法 示意 图 


定义 两 个 二 维 数组 D[3][3] 和 P[3][3]，D 表示 顶点 到 顶点 的 最 短路 径 权 值 和 的 矩阵 ， 书 
表示 对 应 顶点 的 最 小 路 径 的 前 趋 矩 阵 。 初 始 状态 时 ， 我 们 将 D 命名 为 D'， 它 就 是 初始 的 
图 的 邻接 矩阵 ， 将 己 命 名 为 P'， 初 始 化 为 图 中 所 示 的 矩阵 。 

首先 ， 分 析 所 有 的 顶点 经 过 w 后 到 达 另 一 个 顶点 的 最 短路 径 。 因 为 只 有 三 个 顶点 ， 因 
此 需要 查看 vi. 一 wo 一 vp， 得 到 D7[1][0]+D"'[0][2]=2+1=3。D"'[1][2] 表 示 的 是 viv 的 权 值 为 
5, 可 以 发 现 , D"[1][2]> D"[1][O]}+D"[0][2], 也 就 是 说 wi 一 w 一 vw 比 直接 vi 一 vw 的 距离 要 短 。 
所 以 将 D UJJ DA[1]J[0]+D"'[0][2]=3， 同 样 的 ，D"'[2][1]=3， 于 是 有 了 增加 顶点 vo 的 调整 
后 的 DD 和 矩阵 。 因 为 有 了 变化 ， 所 以 P 矩阵 对 应 的 PI[1][2] 和 PA[2][1] 也 修改 为 当前 中 转 项 
点 w 的 下 标 0， 于 是 就 有 了 P 

然后 ,在 D" 和 的 基础 上 继续 处 理 所 有 顶点 经 过 vi 和 vw 后 到 达 另 一 个 顶点 的 最 短路 
径 ， 得 到 及 和 已 、 太 和 疡 ， 完 成 所 有 顶点 到 顶点 的 最 短路 径 的 计算 。 

分 析 上 述 实例 的 算法 实施 过 程 ， 可 以 发 现实 现 上 述 算法 的 关键 在 于 要 保留 每 一 步 所 求 
得 的 、 所 有 顶点 对 之 间 的 当前 最 短路 径 长 度 ， 设 n 个 顶点 从 1 开始 编号 ， 为 此 需要 定义 一 
个 nXn 的 方 阵 序列 44，A'，…，A”"， 来 保存 当前 求 得 的 所 有 顶点 对 之 间 的 最 短路 径 长 度 。 
其 中 ， 才 四 四 表示 从 六 到 疼 的 、 中 间 点 序号 不 大 于 大 的 最 短路 径 长 度 (0 入 koi-D。 




























































































O 
特别 地 ，4" 等 于 G 的 邻接 矩阵 edges, AUEI edges 思 中) 表示 从 vi 到 vw 不 经 过 任何 
中 间 顶 点 的 最 短路 径 长 度 ，A4" 四 中 就 是 从 vi 到 vw 的 最 短路 径 长 度 (0 志 k 筷 n)。 

Floyd 算法 的 基本 策略 是 从 4" 开 始 ， 道 推 地 生成 矩阵 序列 4 ，42，…，A4"， 所 以 如 何 
已 求 得 的 矩阵 A’ 推出 和 是 关键 。 对 于 任何 项 点 对 vo vp ATA v 到 项 点 yy 的、 中间 
点 序号 不 大 于 上 的 最 短路 径 只 有 两 种 情况 : 一 种 是 中 间 不 经 过 顶点 k, 那么 它 仍然 是 前 一 次 
求 出 的 从 vw 到 狼 的 、 中 间 点 序号 不 大 于 K1 RERE, ALFA LD): a hl 
经 过 顶点 k， 该 路 径 由 两 段 路 径 i，…， Kk 和 k，…,j 组 成 ， 它 们 都 是 前 一 次 已 求 出 的 中 间 
点 序号 不 大 于 ol 的 最 短路 径 ， 其 长 度 分 别 为 AAA Aap), Blt, A Adil 
AMAR ATAU], Fie. PGS) ATMA: 

ATi] Fedgesfi[/] 
4 全国 四 =minf Aty] AKHA] 0<k<n-1; 0<i, j<n 
Fb, WT GAG EARS, UAE“ pathan È EERE 
A, path’ [A], ÆA i BU 7 的 中 间 点 序号 不 大 于 kH 的 最 短路 答 上 项 点 的 后 继 顶 点 。 算 
法 结束 时 ， 由 path[i] 四 的 值 可 以 得 到 从 Bj 的 最 短路 径 上 答 个 项 ， fi 
初始 时 ，path[i]0]=0 表示 从 六 到 六 的 路 径 是 是 直达 的 A 以 后 ， 当 
考虑 让 路 径 经 过 某 个 顶点 上 时 ， 若 使 路 径 更 短 ， 则 在 修改 内 四 四 时 ， 要 令 pathy]. m 
生机 点 序列 ， 则 只 需 用 一 ME BAUS, RAEE 







































































哪些 项 点 we? 只 要 去 查找 path [AA ue, 以 此 类 推 , ， 直到 所 碍 元 素 为 0 a: 
弗 洛 伊 德 Floyd 算法 代码 5) \ ‘ 
算法 7.10 Floyd 算法 。17 oN 


void Floyd(G cay HLL 
int ees ; XS N 
for Nic- >n;i++) 不 Ka j 
age A 








;j<=g->n;j++) 


A[i] [j] = g->edges[il] [j]; 
path[i] [j]= 0; 
q 


for (k=1; k<=g->n; k++) 
for( i=1l;i<=g->n ;i++) 
for (j=1; j<=g->n; j++) 
if (A[i] [k] +A(k] [j]< Ali] (31) 
{ Ali] [j] =ALi] [k] +A[k] [j]; 
path[i][j]= k; 


for (i=1;i<=g->n; i++) 
for (j= 1;j<=g->n; j++) 
{ if (A[i][j] = = INTMAX) 
{ Printf(“ 无 路 径 \n”) ;continuey } 
printf (” MAsd MEKSA” , i, Ali] [j]); 
next =path[i] [j]; 
printf (“路 径 为 : $d” ,i ); 


= J 
数据 结构 (C 语言 版 ) ye 
ace 

do { 
printe(” —>4d" 7 next); 
next=path[next][j] ; 
} while (next! = j); 

i 

} 


以 有 向 网 络 Go Arti Sch Ei HGH, BUTTER A 和 path 的 变化 及 其 最 终结 果 如 图 7.30 


所 示 。 
1 2 
和 0 4 Wo 
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3 4 XA 
(a) 有 向 网 Gy Aen 
fo 4 n œ] 3 
1 0 0 
w 0 4 1 \Xx 0 0 0 
A= ' 
5 œ 0 œ| X, 0 0 0 0 
[= = ı Sn 0 0 0 0 
= A 
ES AN 
10 <0 Soo o 
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y S xX 0 0 0 0 
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No’ 0 4 a0 2 2 
/ [lo 0 m0 om 
i= = 
5 9 Moro 2 
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fo 4 8 5] 0 0 2 2 
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| path= 
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[6 0 1 0| 3 3 0 0 
fo 4 6 5] 0 0 4 2 
702 1 40 4 0 
A= path= 
5 9 0 10 0 102 
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(c) 路 径 长 度 和 矩阵 序 列 (d) 路 径 矩 阵 序列 


图 7.30 用 弗 洛 伊 德 算法 求 各 顶点 间 的 最 短路 径 





从 上 面 例子 得 出 的 结果 如 何 求 顶 点 4 到 顶点 2 所 经 过 的 最 短路 径 的 顶点 序列 呢 ? 先 从 
path4[4][2]=3 开始 ， 说 明 由 顶点 4 到 顶点 2 先 经 过 顶点 3， 即 路 径 上 顶点 4 的 后 继 顶 点 是 项 
点 3，path'[4][2]-< path [4][3]，3，Ppath*[3][2]>， 然 后 分 析 path [4][3] 和 path [3][2]， 由 于 
path4[4][3]-0， 于 是 舍 去 path[4][3]， 而 path4[3][2]=1， 于 是 由 顶点 4 到 顶点 2 经 过 的 第 二 
个 顶点 是 1, BI path'[4][2]=<4, 3, path'[3][1]; path [1][2]>, 再 分 析 path*[3][1] 和 path'[1][2]， 
因为 两 个 的 值 都 等 于 0， 因 此 顶点 搜寻 完毕 ， 最 后 求 的 顶点 4 到 顶点 2 的 路 径 为 (4 一 3 一 1 
一 2)， 且 路 径 的 长 度 (最 短 ) 是 41[4][2]=10。 


76 ”校园 电子 导航 平台 的 实现 





(1) 用 邻接 矩阵 保存 各 景点 信息 及 景点 问 路 径 的 信息 。 了 去 





(2) 主 程序 代码 如 下 。 





数据 结构 ( 语言 版 ) 
一 a 








数据 结构 ( 语言 版 ) 
一 So a 








数据 结构 ( 语言 版 ) 
Ses = 








数据 结构 (C 语言 版 ) 
ee A 








if (G.arcs[d] [b] .adj<32767&6P[a] [b]) /* 如 果 景 点 一 和 它 的 一 
个 临界 点 之 间 存在 路 径 且 为 最 短路 径 , 则 进行 如 下 操作 */ 
{ 
printf ("-->%s",G.vex[b] .sight); // 输出 此 节点 的 名 称 
q=q+1; // 计数 变量 加 一 , 满 8 控制 输出 时 换行 
P[a] [b]=0; 
d=b; // 将 b 作为 出 发 点 进行 下 一 次 循环 输出 , 如 此 反复 
if (q%8==0) printf("\n"); 
goto gate; 


| K 
Sa 
vè 独立 实践 ESS 


请 读者 在 上 述 功 能 的 基础 上 增加 hanar 功能 ， 即 设计 路 线 从 任 一 景点 出 








发 ， 游 历 完 所 有 的 景点 。 Xs X 
Ay YN r, AX) 
YA 小 结 : aX 
图 是 一 maniat augini Zanna, 在 其 讲解 中 , 涉及 了 数组 、 
链表 、 栈 、 PO MASZ wt A RRN 学 好 图 ， 基 本 等 于 理解 了 数据 结 
HBT ERO 


本 章 介 绍 了 图 的 基本 概念 和 两 种 常用 的 存储 结构 一 一 邻接 矩阵 和 邻接 表 ， 用 什么 存储 
结构 需要 具体 问题 具体 分 析 ， 通 常 稠密 图 或 读 写 数据 较 多 、 结 构 修改 较 少 的 图 适合 用 邻接 
矩阵 存储 ， 反 之 应 该 考虑 邻接 表 。 图 的 遍历 是 图 的 一 种 主要 操作 ， 分 为 深度 和 广度 两 种 。 

关于 图 的 应 用 ， 本 章 介绍 了 最 小 生成 树 和 最 短路 径 问 题 。 前 者 的 Prim 算法 是 走 一 步 看 
一 步 的 思维 方式 ， 逐 步 生成 最 小 生成 树 ， 而 Kruskal 算法 则 更 有 全 局 意识 ， 直 接 从 图 中 最 
短 权 值 边 入 手 ， 寻 找 最 终 答 案 。 最 短路 径 问 题 在 现实 中 应 用 非常 多 ，Dijkstra 算法 和 Floyd 






































算法 是 常用 的 算法 。 
习 a 
、 填 空 题 
.图 Ff ~ SPRA, 遍历 图 有 等 方法 。 




















2. 有 向 图 G 用 邻接 表 和 矩阵 存储 ， 其 第 1 行 的 所 有 元 素 之 和 等 于 硕 点 1 的 
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3. 用 Prim 算法 求 具 有 个 项 点。 条 边 的 图 的 最 小 生成 树 的 时 间 复 杂 度 为 
Kruskal 算法 计算 的 时 间 复 杂 度 是 






























































4. 图 的 深度 优先 遍历 序列 唯一 的 。 

5. 用 Dijkstra 算法 求 某 一 顶点 到 其 余 各 项 点 间 的 最 短路 径 是 按 路 径 长 度 的 次 
序 来 得 到 最 短路 径 的 。 

6. 图 的 生成 树 是 (请 填 “ 极 大 ”或 “ 极 小 ”) 连 通 子 图 。 

7. ere 条 ; WRA n 个 顶点 的 有 向 完全 
图 的 边 的 总 数 为 条 。 

8. DFS 和 BFS 遍历 分 别 采 用 和 _ 的 数据 结构 来 存储 顶点 ， 当 要 求 连 
通 图 的 生成 树 的 高 度 最 小 时 ， 应 采用 的 遍历 方法 是 

9. 一 个 连通 图 的 生成 树 是 一 个 连通 子 图 , n 个 顶点 的 生成 树 有 条 边 。 
二 、 判 断 题 

K 
1. 图 可 以 没有 边 ， 但 不 能 没有 顶点 。 *- 


2. 带 权 图 的 最 小 生成 树 是 唯一 的 。 


3， 有 向 图 中 的 一 个 顶点 的 度 是 该 顶点 Á 
A. EE EE ARARAT. 


5: RENAME, Prim ROBEN 
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6， 求 最 小 生成 树 时 ， ie 少 、 节 点 较 多 | CT 

7. RE ues n-1, Wi% 连通 图 。 ( 

8. GIES 假设 图 的 顶点 个 则 为 邻接 矩阵 所 付出 的 存储 空间 
就 是 teeta (€) 











9， 邻 接 表 法 只 向 图 的 存储 Re Fa Ea PRA ( ) 


1， 在 一 个 图 中 ， 所 有 项 点 的 度数 之 和 等 于 图 的 边 数 的 ( 。“) 倍 。 




















A. 1/2 B. 1 GC; 2 D. 4 
2， 在 一 个 有 向 图 中 ， 所 有 项 点 的 入 度 之 和 等 于 所 有 顶点 的 出 度 之 和 的 ( 。 “”) 倍 。 
A. 1/2 B. 1 Gi D. 4 
3. 有 8 个 节点 的 无 向 图 最 多 有 ( AA. 
A. 14 B. 28 C. 56 D. 112 
4. 有 8 个 节点 的 无 向 连通 图 最 少 有 ( ”) 条 边 。 
A. 5 B. 6 Cx 7 D. 8 
5. 用 邻接 表 表示 图 进行 深度 优先 遍历 时 ， 通 常 是 采用 ( ) 来 实现 算法 的 。 
A. 栈 B. 队列 c. 树 D. 图 
6. 已 知 图 的 邻接 表 如 图 7.31 所 示 ， 根 据 算法 ， 则 从 顶点 0 出 发 按 深度 优先 遍历 的 节 








点 序列 是 ( )- 





数据 结构 (C 语言 版 ) O) 
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图 7.31 某 图 的 邻接 表 





A. 0132 B. 0231 €: 0321 D. 0123 
7. 深度 优先 遍历 类 似 于 二 叉 树 的 ( 。”)。 
A. 先 根 遍 历 B. 中 根 遍 历 C. 后 根 遍历 D. 层次 遍历 


8. 广度 优先 遍历 类 似 于 二 叉 树 的 ( 。”)。 
A. 先 根 遍 历 B. 中 根 遍 历 C. 后 根 遍历 D. 层次 遍历 
9. 已 知 图 的 邻接 矩阵 如 图 7.32 所 示 ， 根 据 算法 思想 ， 则 从 项 上 0 出 发 按 深度 优先 遍 


历 的 节点 序列 是 ( 。 )。 AS 
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1 
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DEIS 


A. 0243156 „B. 0135642 E: 423165 D. 0134256 
10. FS RAT ERIAN NE IRAC O) ”来 实现 算法 的 。 














AR ZAB 队列 oe OH D. 图 
m | > 
L 已 知 如 图 7.33 所 示 的 有 向 图 ， 请 给 出 该 图 的 每 个 顶点 的 入 /出 度 ， 邻 接 矩 阵 ， 邻 接 
表 ， 逆 邻接 表 。 





2. 已 知 如 图 7.34 所 示 的 无 向 带 权 图 ， 请 
(1) 写 出 它 的 邻接 矩阵 ， 并 按 Prim 算法 求 其 最 小 生成 树 。 
(2) 写 出 它 的 邻接 表 ， 并 按 Kruskal 算法 求 其 最 小 生成 树 。 








A733 某 有 向 图 图 7.34 无 向 带 权 图 
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3. 已 知 二 维 数组 表示 的 图 的 邻接 和 矩阵 如 图 7.35 所 示 。 试 分 别 画 出 自 项 点 a 出 发 进行 | 
遍历 所 得 的 深度 优先 生成 树 和 广度 优先 生成 树 。 

4. 试 利用 Dijkstra 算法 求 图 7.36 所 示 的 有 向 图 G4 中 从 顶点 a 到 其 他 各 顶点 间 的 最 短 
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5 7 
0 1 
0 1 
0 0 
1 0 
0 0 
0 0 
0 0 
0 0 
1 1 
0 0 
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图 7.35 ae 图 7.36 有 向 图 GA 
5. 给 定 下 列 网 G， 则 
(1) 试 找 出 网 G E a 
O 用 两 种 不 同 的 表示 法 画册 网 G TERRORIT 








图 7.37 存储 结构 图 


五 、 编 程 题 


1. 设计 算法 求解 距离 顶点 vo 最 远 的 一 个 顶点 。 

2. 设 有 向 图 以 邻接 表 存 储 ， 设 计算 法 删除 图 中 的 弧 <v;，v>。 

3， 设 计算 法 判断 无 向 图 G 是 否 连 通 。 若 连通 则 返回 TRUE, FURE FALSE. 
4， 写 出 图 的 深度 优先 搜索 算法 的 非 递归 算法 。 
5 
#4 





. 设 有 向 图 G 有 AHAH 1，2，3，…， 门 表示 ，e 条 边 ， 编 写 一 个 算法 根据 其 邻 
接 表 生成 其 逆 邻 接 表 ， 要 求 算法 复杂 度 为 O(nt+e)。 
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奥运 会 奖牌 排名 系统 


AREAWETHALRY, HSARRDK, SERRA i Mh LIRIK 
项 ， 如 表 8.1 所 示 。 请 实现 以 下 功能 : 输出 奖牌 榜 \， 基 本 规则 为 金牌 数 多 者 名 次 优先 ， 金 
牌 数 相等 则 比较 银牌 数 ， 银 牌 数 相同 则 比较 钼 牌 数 ;| 如 全 部 相等 则 为 并 列 名 次 ， 并 按 表 格 
形式 输出 ; 对 奖牌 总 数 进行 排 名 ， 和 否则 为 并 到 党 次 ， 并 按 表 格 形式 给 出。 


met anes 示例 

















排序 (Sorting) 是 数据 处 理 中 经 常 使 用 的 一 种 重要 运算 。 如 何 进 行 排序 , 特别 是 高 效 地 进 
行 排序 是 计算 机 应 用 中 的 重要 课题 之 一 。 
在 本 章 中 ， 我 们 假定 被 排序 的 对 象 是 由 一 组 记录 组 成 的 文件 ， 而 记录 则 由 若干 个 数据 
项 (或 域 ) 组 成 ， 其 中 有 一 项 可 用 来 标识 一 个 记录 ， 称 为 关键 字 项 ， 该 数据 项 的 值 称 为 关键 
字 。 关 键 字 可 用 来 作为 排序 运算 的 依据 ， 它 可 以 是 数学 类 型 ， 也 可 以 是 字符 类 型 ， 选 取 记 
录 中 的 哪 一 项 作为 关键 字 ， 根 据 问题 的 要 求 而 定 。 例 如 ， 在 高 考 成 绩 统计 中 将 每 个 考生 作 
为 一 个 记录 ， 它 包含 准 考证 号 ， 姓 名 、 语 文 、 外 语 、 物 理 、 化 学 、 生 物 的 分 数 和 总 分 数 等 
内 容 ， 若 要 唯一 地 标识 一 个 考生 的 记录 ， 则 必须 用 “ 准 考证 号 ”作为 关键 字 ; 若 要 按照 考 
生 的 总 分 数 排名 次 ， 则 需要 用 “总 分 数 ” 作 为 关键 字 。 

所 谓 排序 ， 是 把 一 组 记录 或 数据 元 素 的 无 序 序列 按照 某 个 关键 字 值 (关键 字 ) 递 增 或 递 
减 的 次 序 重新 排列 的 过 程 。 若 给 定 的 文件 含有 n 个 记录 名，R，…，R}， 它 们 的 关键 字 
DAE {ko ko s kno ME 1，2，…， 半 的 一 种 排序 石 ， 尼 ，…， 六 ， 使 其 相应 的 关键 
字 满足 如 下 关系 : kaSkoSe Shiny BEHR Ro o Ri} HIPAA MERE A 
































































































































序 的 序列 ， 也 就 是 {Ria，Rp，…，Rn}。 这 个 将 原 有 表 中 任意 顺序 的 记录 变 成 一 个 按 关 键 字 
有 序 排列 的 过 程 称 为 排序 。 

待 排序 记录 序列 可 以 用 顺序 存储 结构 或 链 式 存储 结构 表示 。 在 本 章 讨 论 中 ， 若 无 特别 
说 明 ， 均 假定 待 排序 记录 序列 采用 顺序 表 结 构 来 存储 ， 即 用 一 位 数组 实现 ， 并 且 假 定 按 关 
键 字 非 递减 方式 排序 。 为 了 简单 起 见 ， 假 设 关键 字 类 型 是 整 型 ， 此 结构 定义 适用 于 下 面 讲 
的 所 有 的 排序 算法 ， 其 定义 如 下 。 


typedef int KeyType; 
typedef struct{ 




















KeyType key; // 关 键 字 域 
InfoType otherinfo; // 记 录 的 其 他 域 , 根据 具体 应 用 来 定义 
}RecType; // 记 录 类 型 
typedef RecType SqList[n+1]; // 记 录 类 型 的 数组 ， Kenan 
排序 算法 的 稳定 性 : O E 结果 是 唯一 的 ， 否 
则 排序 的 结果 不 一 定 唯一 。 如 果 待 排序 的 文件 中 ， sri ee. 经 过 排 
有 相关 则 称 这 种 排序 方法 是 稳定 的 ; 


反之 ， mle aes 排序 方法 是 不 稳定 的 。 
HLS Piety ho) :排序 过 程 中 ， 若 整个 文件 都 放 在 内 存 
中 处 理 ， 排 序 时 不 涉及 数据 内 、 外 存 交 I 称 之 为 内 部 排序 (简称 内 排序 )， 反 之 ， 若 排 
序 过 程 中 要 进行 数据 的 内 、 外 存 交换 六 cco 序 )。 内 排序 适用 于 记 
录 个 数 不 是 很 多 的 小 文件 ， 外 排序 Wig ee 
存 的 大 文件 。 本 章 只 讨论 党 用 的 内 排序 方法 。 nara. 同 ， 内 排序 方法 可 以 分 为 五 























类 : 插入 排序 、 选 择 排序 “交换 排序 、 归 并 排序 

要 在 繁多 的 排序 方法 由” 简单 地 判断 哪 一 pom 以 便 能 普遍 选用 是 困难 的 。 评 论 
JTRS ARE ERA: 第 一 行 时 所 需 的 时 间 ， 第 二 条 是 执行 算法 所 
需要 的 辅助 存储 空间 。 另 外 ， 算 法 本 身 的 赣 困 程度 也 是 考虑 的 一 个 因素 。 因为 排序 算法 所 
需 的 辅助 空间 二 般 都 不 大 ， 了 矛盾 并 不 突出 ， 而 排序 是 经 常 执行 的 一 种 运算 ， 往 往 属于 系统 
的 核心 部 分 ， 因 此 ， 排 序 的 时 间 开 销 是 算法 好 坏 的 最 重要 的 标志 。 排 序 的 时 间 开 销 主要 是 
指 执行 算法 中 关键 字 的 比较 次 数 和 记录 移动 的 次 数 ， 因 此 , 在 下 面 讨论 各 种 内 排序 算法 时 ， 
我 们 将 给 出 各 种 算法 的 比较 次 数 及 移动 次 数 。 


8.2 插入 排序 






























































插入 排序 (Insertion Sorb) 的 基本 思想 : 每 次 将 一 个 待 排序 的 记录 ， 按 其 关键 字 大 小 插入 
到 前 面 已 经 排 好 序 的 文件 中 的 适当 位 置 ， 直 到 全 部 记录 插入 完成 为 止 。 本 节 介 绍 直接 插入 
排序 和 和希 尔 排序 。 


8.2.1 直接 插入 排序 


假设 待 排序 的 记录 存放 在 数组 R 中 ， 排 序 过 程 的 某 一 中 间 时 刻 ，R 被 划分 成 两 个 子 区 
间 [R[1]，R[i-1]] 和 [R[]，R[n]]， 其 中 ， 前 一 个 子 区 间 是 已 排 好 序 的 有 序 区 ; 后 一 个 子 区 间 
则 是 当前 未 排序 的 部 分 ， 不 妨 称 其 为 无 序 区 。 直 接 插 入 排序 的 基本 操作 是 将 当前 无 序 区 的 





























数据 结构 (- BSI ( ) ) 
一 ð 


第 1 个 记录 R 四 插入 到 有 序 区 中 适当 位 置 ， 使 得 R[1] 到 R 四 变 为 新 的 有 序 区 。 

初始 时 ， 令 去 1， 因 为 一 个 记录 时 自然 是 有 序 的 ， 故 R[1] 自 成 为 一 个 有 序 区 , 无 序 区 则 
是 R[2] 到 R[n]， 然 后 依次 将 R[2]，R[3]，… 插 入 到 当前 的 有 序 区 中 ， 直 至 in 时， 将 Rin] 
插入 到 有 序 区 为 止 。 

但 现在 有 一 个 问题 ， 即 如 何 将 一 个 记录 R[i](i=2，3，…，n) 插 入 到 当前 的 有 序 区 ， 使 
得 插入 后 仍 保证 该 区 间 记 录 是 按 关 键 字 有 序 的 。 显 然 ， 最 简单 的 方法 如 下 : 首先 ， 在 当前 
有 序 区 R[1] 到 R[i-1] 中 查找 RD 的 正确 插入 位 置 ASKi); 然后 ， 将 R[ 有 到 Rp- HE 
录 均 后 移 一 个 位 置 , 腾 出 上 位 置 上 的 空间 插入 R[]. 当然 , 若 RD 的 关键 字 大 于 R[1] 到 RE] 
中 所 有 记录 的 关键 字 ， 则 Ri 就 插入 原 位 置 。 但 是 ， 更 为 有 效 的 方法 是 使 查找 比较 操作 和 
记录 移动 操作 交 蔡 地 进行 ， 具 体 做 法 是 将 待 插入 记录 R[i] 的 关键 字 依 次 与 有 序 区 中 的 记录 
Pe ee 
后 移 一 个 位 置 ， 若 RD 的 关键 字 小 于 或 等 于 RE, RA, j+ BUY R 
的 插入 位 置 。 因 为 关键 字 比 R[] 的 关键 字 大 的 记录 均 已 后 所 以 +1 的 位 置 已 经 腾空 ,只 只 
要 将 RD 直接 插入 此 位 置 即 可 。 





















































算法 8.1 直接 插入 排序 。 
void InsertSort (SeqList R) “nae R 按 递 增 序 进行 插入 排序 */ 


{ /* R[0] 是 监视 哨 */ 
int i3; “is 
for(i=2; i<=n; > 
7 a 
aie K 
j=i-1; 
K ( Darr o 查找 R[i] 的 插入 位 置 */ 


[3+1]=R[j--]; 将 关键 字 大 于 R[i1] .key 的 记录 后 移 */ 


Xenaro, /* 插入 R[i] */ 
} 
/* 插 入 排序 */ 


算法 中 引进 附加 记录 R[0] 有 两 个 作用 : 其 一 是 进入 查找 循环 之 前 ， 它 保存 了 RWIE 
本 ， 使 得 不 至 于 因 记录 的 后 移 而 丢失 R[ 中 的 内 容 : 其 二 是 在 while 循环 “监视 ”下 标 变量 
是 否 越界 ， 一 旦 越界 ( 即 产 D)，R[0] 自 动 控制 while 循环 的 结束 ， 从 而 避免 了 在 while 循环 
内 的 每 一 次 都 要 检测 j 是 否 越界 ( 即 省 略 了 循环 条 件 “j 三 1”)。 因 此 ， 我 们 把 R[0] 称 为 “ 监 
视 哨 ”， 这 种 技巧 使 得 测试 循环 条 件 的 时 间 大 约 减 少 一 半 ， 对 于 记录 数 较 大 的 文件 ， 节 约 的 
时 间 是 相当 客观 的 。 

按照 上 述 算法 ， 我 们 用 一 个 例子 来 说 明 直 接 插入 排序 的 过 程 。 设 待 排序 的 文件 有 八 个 记 
录 ， 其 关键 字 分 别 为 23、4、15、8、19、24、15'。 为 了 区 别 两 个 相同 的 关键 字 15， 我 们 在 
后 一 个 15 右上 加 了 一 撤 以 示 区 别 。 其 排序 过 程 如 图 8.1 所 示 , 图 中 用 括号 表示 当前 的 有 序 区 。 

直接 插入 排序 算法 由 两 重 循 环 组 成 ， 对 于 有 n 个 记录 的 文件 外 循环 表示 要 进行 n1 趟 
插入 排序 ， 内 循环 表明 完成 一 趟 排序 所 需 进 行 的 记录 关键 字 间 的 比较 和 记录 的 后 移 。 若 初 
台 文 件 按 关 键 字 递增 有 序 (以 下 简称 “ 正 序 ”)， 则 在 每 一 趟 排序 中 仅 需 进 行 一 次 关键 字 的 
































> 
© = ”Sg 
比较 ， 此 时 n-1 趟 排序 总 的 关键 字 比较 次 数 取 最 小 值 Cin ds 并 且 在 每 一 趟 排序 中 ， 无 
需 后 移 记 录 。 但 是 ， 在 进入 while 循环 之 前 ， 将 RD 保存 到 监视 哨 R[0] 中 需 移动 一 次 记录 ， 
在 该 循环 结束 之 后 将 监视 哨 中 RD] 的 副本 插入 到 RL+1] 也 需要 移动 一 次 记录 ， 此 时 排序 过 
程 总 的 记录 移动 此 数 也 取 最 小 值 Mwin=2(n-1)。 反 之 ， 若 初始 文件 按 关 键 字 递增 有 序 (以 下 
简称 “ 反 序 ”)， 则 关键 字 的 比较 次 数 和 记录 移动 次 数 均 取 最 大 值 。 在 反 序 情况 下 ,对 于 for 
循环 的 每 一 个 i 值 , 因为 当前 有 序 区 R[1] 到 R[i-1] 的 关键 字 均 大 于 待 插 入 记录 RINE 
所 以 while 循环 中 要 进行 i 次 比较 才 终 止 ,并 且 有 序 区 中 所 有 的 六 1 个 记录 均 后 移 一 个 位 置 ， 
再 加 上 while 循环 前 后 的 两 次 移动 ， 则 移动 记录 的 次 数 为 -1+2。 由 此 可 得 排序 过 程 关 键 字 
比较 总 次 数 的 最 大 值 Coax 和 记录 移动 总 次 数 的 最 大 值 Mmao BI 
Crax =Y i=(n+2(n-1)/2= O(n’) 


i=2 


HAKEE: [23] 4 15 8 y Ose 15 


第 一 越 排序 结果 ; [4 23] 15 as 19 24 6 
第 一 趟 排序 结果 : [4 15 Nh: 19 24 15 












































第 三 趋 排序 结果 : [4 


NS 15 23] 19 24 15 
、 

第 由 趟 排序 结果 : ~ 
a sancti) — uos wy 9O B3 2 5 


AFR: [4 8 Is 15 19 23 24] 
图 8.1 直接 插入 排序 


M ax = (i-142) = (n+ (in +4)/2= O(n’) 


i=2 

上 述 分 析 可 知 ， 当 文件 的 初始 状态 不 同时 ， 直 接 插入 排序 所 耗费 的 时 间 是 有 很 大 差 
异 的 。 最 好 情况 是 文件 初始 态 为 正 序 ， 此 时 算法 的 时 间 复杂 度 为 O00)， 最 坏 情况 是 文件 初 
始 态 为 反 序 ， 相 应 的 时 间 复 杂 度 为 O(n”)。 容 易 证 明 ， 算 法 的 平均 时 间 复 杂 度 也 是 O(n"). 
显然 ， 算 法 所 需 的 辅助 空间 是 一 个 监视 哨 ， 故 空间 复杂 度 S(n)=0O(1)。 

直接 插入 法 排序 是 稳定 的 排序 方法 。 
8.2.2 ” 希 尔 排序 

希 尔 排序 (Shell's Method) 又 称 “ 缩 小 增 量 排序 (Diminishing Increment)”, 是 由 D. L. Shell 
在 1959 年 提出 来 的 。 它 的 作用 是 先 取 定 一 个 小 于 n 的 整数 di 作为 第 一 个 增 量 ， 把 文件 的 


全 部 记录 分 成 di 个 组 ,， 所 有 距离 为 d 倍数 的 记录 放 在 同一 个 组 中 , 在 各 组 内 进行 直接 插入 
HEF; 然后 ， 取 第 二 个 增 量 d,<d 重复 上 述 分 组 和 排序 ， 直 至 所 取 的 增 量 dAd <da 
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数据 结构 (C 语言 版 ) O) 
Steal i 


<d,<d)), BURT AIR BCE] — A ET Bed AEE I. 

先 从 一 个 具体 例子 来 看 希 尔 排序 过 程 。 假设 待 排序 文件 有 10 个 记录 ， 其 关键 字 分 别 是 
52，40，68，95，79，10，28，52*，58，06。 增 量 序列 取 值 依次 为 5，3，1。 

第 一 趟 排序 时 ，d=5， 整 个 文件 被 分 成 五 组 : (RI，Re)，(R2，R7)，…，(Rs，Rio)， 各 
组 中 的 第 一 个 记录 都 自 成 一 个 有 序 区 ， 我 们 依次 将 各 组 的 记录 Re，R7，…，Rio 分 别 插入 到 
各 组 的 有 序 区 中 ， 使 文件 的 各 组 均 是 有 序 的 ， 其 结果 如 图 8.2 所 示 的 第 七 行 。 

第 二 趟 排序 时 ，q,=3， 整 个 文件 分 成 (RI，R4，R1，R10)， (Ro Rs» Rs), (Rar Res Ro)» 
各 组 的 第 一 个 记录 仍 自 成 一 个 有 序 区 ， 然 后 依次 将 各 组 的 记录 Ry Rs Re 分别 插入 到 该 组 
的 当前 有 序 区 中 ， 使 得 (RI,，R4)，(R,，Rs)，(R3，Re) 均 变 为 新 的 有 序 区 ， 再 依次 将 各 组 的 
记录 Ry Rgs Ro 分别 插 入 到 该 组 的 有 序 区 中 ， 又 使 得 (R，R4，R7)，(R2，R5，Rs)，(R3，R6， 
Ro) 均 变 为 新 的 有 序 区 ， 最 后 将 Rio 插 入 到 有 序 区 (Ri，R4，R7?) 中 就 得 到 第 二 趟 排序 结果 。 

第 三 趟 排序 时 ， 必 =1， 即 对 整个 文件 做 直接 插入 排序 ， 其 结 黑 即 为 有 序 文件 ， 

排序 过 程 如 图 8.2 所 示 。 


SN 
初始 关键 字 52 40 68 95 79.: yy 52* 58 06 
ax 
28 















































、 
bS P 
y S 79 x X 06 
: 68 95 79 


asi. io 28 52+ 58 06182 40 
et 10 , 40 








79 
a | p 
NP 28 不 06 68 
N 52* 52 95 
L 1 J 
二 趟 排序 结果 10 06 52* 40 28 52 58 68 95 79 


三 趟 排序 结果 06 10 28 40 52* 52 58 68 79 95 
图 8.2 希 尔 排序 
若 不 设置 监视 哨 ， 根 据 上 例 的 分 析 不 难 写 出 希 尔 排序 算法 ， 请 读者 自行 完成 。 下 面 我 
们 先 分 析 如 何 设 置 监视 哨 ， 然 后 给 出 具体 算法 。 设 某 一 趋 希 尔 排序 的 增 量 为 %”， 则 整个 文 
件 被 分 成 h 组 : (Riv Reo Rowers e) (Ros Rez Rimo 0e) ee (Ri Rom Row +e)» 
因为 各 组 中 记录 之 间 的 距离 均 是 h WGB 1~h 租 的 哨兵 位 置 依次 为 1-h，2-h，…，0。 如 
果 像 直接 插入 排序 算法 那样 ， 将 待 插入 记录 RA(h+1 志 i 志 n) 在 查找 插入 位 置 之 前 保存 到 监视 
哨 中 ， 那 么 必须 先 计算 R; 属 于 哪 一 组 ， 才 能 决定 使 用 哪个 监视 哨 来 保存 Ri。 为 了 避免 这 种 
计算 ,我 们 可 以 将 Ri; 保存 到 另 一 个 辅助 记录 x 中 ， 而 将 所 有 监视 哨 RI，R24，…，Ro 的 关 
键 字 ， 设 置 为 小 写 文件 中 的 任何 关键 字 。 因 为 增 量 是 变化 的 ， 所 以 各 趟 排序 中 所 需 的 监视 
哨 数目 也 不 相同 ， 但 是 可 以 按 最 大 增 量 四 来 设置 监视 哨 。 具 体 算法 描述 如 下 。 
























































算法 8.2 BRHF. 


void ShellSort (SeqList R,int d[]) 

{ /* R[0] 到 R[di-1] 为 di 个 监视 哨 ，d[0] 到 ad[t-1] 为 增 量 序列 */ 
int i,j,k,h; 
rectype temp; 





int maxint=32767; /* 机 器 中 最 大 整数 */ 
for(i=0; i<d[0]; i++) 
R[i] .key=-maxint; /* 设置 哨兵 */ 
K=0; 
do { 
h=d[k]; /* 取 本 趟 增 
for(i=h+di; i<n+dl; i++) /* RUh+d, i-1] 插 入 当前 有 序 区 */ 


{ 


temp=R[i]; pane RIi] */ 
j=i-n; 


while (temp. key<R[j] 查找 正确 的 插入 位 置 */ 
{ RY 
TORGE /* 后 移 记录 */ 
mas /* ase */ 
pee 
A, Vie ARC sy 
A ý 
Ayt WE /* 增 量 为 1 排序 后 终止 算法 */ 
} 


可 能 看 出 ， 当 增 量 h=1 时 ，ShellSort 算法 与 InsertSort 基本 一 致 。 

人 们 对 希 尔 排 序 的 分 析 提 出 了 许多 困难 的 数学 问题 ， 特 别 是 如 何 选择 增 量 序列 才能 产 
生 最 好 的 排序 效果 ， 至 今 没 有 得 到 解决 。 读 者 可 参考 D. E.Knuth 所 著 的 《计算 机 程序 设计 
技巧 ) 第 三 卷 ， 此 书 给 出 了 希 尔 排序 的 平均 比较 次 数 和 平均 移动 次 数 都 在 n 左右 。 

为 什么 希 尔 排序 的 时 间 性 能 优 于 直接 排序 插入 排序 呢 ? 我 们 知道 直接 插入 排序 在 文件 
初始 态 为 正 序 时 所 需 时 间 最 少 ， 实 际 上 ， 当 文件 初始 态 基本 有 序 时 直接 排序 所 需 的 比较 和 
移动 次 数 均 较 少 。 而 当 n 值 较 少时 ，n 和 到 的 差别 也 较 小 ， 即 直接 插入 排序 的 最 好 时 间 复 
杂 度 O(n) 和 最 坏 时 间 复杂 度 O(n”) 差 别 不 大 。 在 希 尔 排序 开始 时 增 量 较 大 , 分 组 较 多 , 每 组 
的 记录 数目 少 ， 故 各 组 内 直接 插入 较 快 ， 当 增 量 di 逐渐 缩小 时 ， 分 组 数 直 接 减 少 ， 而 各 组 
的 记录 数目 逐渐 增多 ， 但 由 于 已 经 按 必 作为 距离 排 过 序 ， 使 文件 较 接 近 于 有 序 状态 ， 所 
以 新 的 一 趟 排序 过 程 也 较 快 ， 因 此 ， 和 希 尔 排 序 在 效率 上 较 直 接 插 入 排序 有 较 大 的 改进 。 

希 尔 排序 是 不 稳定 的 。 参 见 图 8.2， 该 例 中 两 个 相同 关键 字 49 在 排序 前 后 的 相对 次 序 
发 生 了 变化 。 
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8.3 交换 排序 


换 排 序 的 基本 思想 : 两 两 比较 待 排序 记录 的 关键 字 ， 发 现 两 个 记录 的 次 序 相反 时 即 进 
行 交 换 ， 直 到 没有 反 序 的 记录 为 止 。 本 节 介 绍 两 种 交换 排序 : 冒 泡 排序 和 快速 排序 。 


8.3.1 冒 泡 排序 


设想 被 排序 的 记录 数组 R[0] 到 R[n-1] 垂 直 竖 立 ， 将 每 个 记录 R[I 看 作 质 量 为 Ri.key 的 气 
泡 。 根据 轻 气 泡 不 能 在 重 气 泡 之 下 的 原则 , 从 上 往 下 扫描 数组 R, 凡 扫 描 到 违反 原则 的 轻 气泡 ， 
就 使 其 向 上 “漂浮 ” 如 此 反复 进行 ， 直 到 最 后 任何 两 个 气泡 都 是 轻 者 在 上 ， 重 者 在 下 为 止 。 
初始 时 ，R[0] 到 R[n-1] 为 无 序 区 ， ne KENAN we Mit 











质量 ， 若 发 现 轻 者 在 下 ， 重 者 在 上 ， 则 交换 两 者 的 位 置 。 本 趟 扫 时 ,“ 最 轻 ” 的 气泡 
就 漂浮 到 顶端 ， AAN, KE a i 扫描 时 , 只 需 扫 视 R[1] 
到 R[n-1]， 扫描 完毕 时 ,“ 次 轻 ” 的 气泡 漂浮 到 R[1] 一 般 地 ,第 i 趟 扫描 时 ，R[0] 
到 R[i-1] 和 RD 到 R[n-1] 分 别 为 当前 的 有 序 区 和 无 序 区 ,扫描 仍 是 从 无 序 区 底部 向 上 直至 该 
区 项 部， 扫描 完毕 时 ， 该 区 中 最 轻 气泡 漂浮 到 顶部 RULE, BRA ROJS REJI K 
ARK. 图 8.3 是 冒 泡 排序 过 程 的 示例 , 第 pk 第 2 列 起 依次 为 各 趟 排序 ( 即 
各 趟 扫描 ) 结 果 ， EN E E 序 区 。 
第 W 多 多 
i iF \ RS 3 4 2)§ 
次 W A A ai 
AKA ae A 名 
X KOR 果 RYE 果 R 

















j or os A055 os os 
NS 40 SI 32) 32 32 32 z 
62 40 SI 40 40 40 40 
87 6 40 5 40* 40* 40* 
78 87 62 40% St SI SI SI 
05 78 87 62 6 62 62 62 
32 32 B 87 B B B B 
40* 40* 40 78 87 87 87 87 
图 8.3 ”从 下 往 上 扫描 的 冒 泡 排序 各 赵 结 果 


为 每 一 趟 排序 都 使 有 序 区 增加 一 个 气泡 , 在 经 过 n-1 趟 排序 之 后 , 有 序 区 中 就 有 n-1 
个 气泡 ， 而 无 序 区 中 气泡 的 质量 总 是 大 于 等 于 有 序 区 中 气泡 的 质量 ， 所 以 ， 整 个 起 泡 排序 
过 程 至 多 需要 进行 n-1 趟 排序 。 但 是 ， 若 在 某 一 趟 排序 中 未 发 现 气泡 位 置 的 交换 ， 则 说 明 
待 排序 的 无 序 区 中 所 有 气泡 均 满足 轻 者 在 上 ， 重 者 在 下 的 原则 ， 因 此 ， 起 泡 排序 过 程 可 在 
此 趟 排序 后 终止 。 在 图 8.3 的 示例 中 ,在 第 五 趟 (图 中 第 6 列 ) 排 序 过 程 中 就 没有 冒 泡 交换 位 


Qe 
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置 ， 此 时 整个 文件 已 达到 有 序 状 态 。 为 此 ， 在 下 面 给 出 的 算法 中 ， 我 们 引入 一 个 布尔 量 
noswap， 在 每 趟 排序 之 前 ， 将 它 置 为 TRUE。 当 一 趟 排序 结束 时 ， 检 查 noswap， 若 未 曾 交 
换 过 记录 便 终 止 算法 。 
算法 8.3 冒 泡 排 序 。 
void BubbleSort (SeqList R) /* 从 下 往 上 扫描 的 起 泡 排序 */ 
{ 





int i,j,noswep; 
rectype temp; 
for (i=0; i<n-1; i++) /* 做 n-1 趟 排序 */ 
{ 
noswap=TRUE; /* 置 未 交换 标志 */ 
for (j=n-2; j>=i; j-- ) /* WEE EAA */ 
if (R[j+1] .key<R[j] .key) ES BRERA 
{ 
temp=R[j+1]; 人 
RIj+1]=R[j]; a 
R[j]=temp; 
noswap=FALSE; 
} 
if(noswap) brea ey. 本 趟 排序 中 未 发 生 交 换 , 则 终止 算法 / 
} 
} 


容易 看 出 ， TINET Sa 关键 字 的 比较 次 数 
为 -1， 且 没有 记录 移动 6 也 就 是 说 ， 起 泡 排 eben. 时 间 复杂 度 是 O(n)。 若 初 


始 文 件 是 反 序 的 , 则 需要 进行 -1 A AFRA Sati n I BORIS, 
va 在 这 种 情况 下 ， 比 较 移 动 次 数 均 达 
到 最 大 值 ， 即 


Crax =F (n-i) = nn-D)/2= 0 ) 


M vax = F307) = 3n(n—1)/2 = O(n?) 
i=l 


因此 ， 起 泡 排序 的 最 坏 时 间 复 杂 度 为 O(n”)。 它 的 平均 时 间 复杂 度 也 是 OC?) SEAR, 
起 泡 排序 是 稳定 的 。 


8.3.2 ”快速 排序 


快速 排序 (Quick Sorb 又 称 划 分 交换 排序 .其 基本 思想 是 :在 当前 无 序 区 R[low] 到 R[high] 
中 任 取 一 个 记录 作为 比较 的 “基准 ”( 不 妨 记 为 temp)， 用 此 基准 将 当前 无 序 区 划分 为 左右 
两 个 较 小 的 无 序 子 区 : R[low] 到 R[ 订 1] 和 R[i+1] 到 R[high]， 且 左边 的 无 序 子 区 中 记录 的 关 
键 字 均 小 于 或 等 于 基准 temp 的 关键 字 , 右边 的 无 序 子 区 中 记录 的 关键 字 均 大 于 或 等 于 基准 
temp 的 关键 字 ， 而 基准 temp 则 位 于 最 终 排序 的 位 置 上 ， 即 
R[low] 到 Ril] PEF <temp.key<R[i+1] 4) R[high] 的 关键 字 (low 志 i<high) 
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数据 结构 (C 语言 版 ) 
a = 
人 i 

当 RIlow] 到 RED 和 RH 到 R[high] 均 非 空 时 , 分 别 对 它们 进行 上 述 的 划分 过 程 , 直至 
所 有 无 序 子 区 中 记录 均 已 排 好 序 为 止 。 

要 完成 对 当前 无 序 区 R[low] 到 R[high] 的 划分 ， 具 体 做 法 是 : 设置 两 个 指针 i 和 j， 它 们 
的 初 值 分 别 为 =low 和 j=high。 不 妨 取 基准 为 无 序 区 的 第 1 个 记录 RIE Row) 并 将 它 保 
存在 变量 temp 中。 令 j A high 起 向 左 扫描 , 直到 找到 第 1 个 关键 字 小 于 temp.key 的 记录 Rj， 
将 RUBE i 所 指 的 位 置 上 (这 相当 于 交换 了 RUMANE RB temp) 的 位 置 ， 使 关键 字 小 于 
基准 关键 字 的 记录 移 到 了 基准 的 左边 ); 然后 ， 令 i 自 it1 起 向 右 扫描 ， 直 至 找到 第 1 个 关键 
字 大 于 temp.key 的 记录 R[], 将 R 移 至 j 指 的 位 置 上 (这 相当 于 交换 了 RD 和 基准 R[j]( 即 temp) 
的 位 置 ， 使 关键 字 大 于 基准 关键 字 的 记录 移 到 了 基准 的 右边 ); 接着 , 令 j 自 i1 起 向 左 扫描 ， 
如 此 交 蔡 改变 扫描 方向 ， 从 两 端 各 自 往 中 间 靠 拢 ， 直 至 =j 时 ，i 便 是 基准 temp 的 最 终 位 置 ， 
将 temp 放 在 此 位 置 上 就 完成 了 一 次 划分 。 : 

综合 上 面 的 叙述 ， 下 面 给 出 排序 的 算法 。 YA 

算法 8.4 ”快速 排序 


r K 
rÁ% N 
X> 
int PARTITION (SeqList R,low,high) x \ 
Z 





























\ 


{/* 返回 划分 后 被 定位 的 基准 记录 的 位 置 */ 并 
int i,j; xy 
rx 
RecType temp; “XX, 
i=low; j=high; temp=R sty K /* 初始 化 temp 为 基准 */ 
Sos SA a 
while((R[j].k =temp.key) && (i 
josh) -入 从 右 向 左 扫描 ,查找 第 二 个 关键 字 小 于 tenp. key 的 记录 */ 
if (#<j) SR[i++]=R[j]; Ve 变换 RIi] 和 RI] */ 
_ while((R[i].key<=temp>key) sg& (i<j)) 
os, A 


RE 1 个 关键 字 大 于 temp. key 的 记录 */ 


Solemn Keen 
XY! if(i<j) REJ--]=REETs  /* 交 换 R[i] 和 R[j]*/ 
NY while(i < j); 
R[i]=temp; /* 基 准 temp 已 被 最 后 定位 */ 
return i; 


} 


void QuickSort (SeqList R,int low,int high) 
{/* 对 RI[low] 到 R[high] 快 速 排序 */ 


int i; 

if (low<high) /* 只 有 一 个 记录 或 无 记录 时 无 需 排序 */ 
i=PARTITION (R, low, high) ; /* 对 R[low] 到 R[high] 做 划分 */ 
QuickSort (R,low,i-1); /* 递 归 处 理 左 区 间 */ 
QuickSort (R,i+1,high); /* 递 归 处 理 右 区 间 */ 





} 
注意 : 对 整个 文件 ROJE R[n-1] 排 序 ， 只 需 调用 Quicksort(R，0，n-1) 即 可 。 
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9 =e sy 
图 8.4 展示 了 一 次 划分 的 过 程 及 整个 快速 排序 的 过 程 。 图 中 方 括号 表示 无 序 区 ， 方 框 表 
示 基 准 temp 的 关键 字 ， 它 未 参加 真正 的 交换 ， 只 交 在 划分 完成 时 才 将 它 放 到 正确 的 位 置 上 。 
PIS IRAE IGD 78 05 32 a ] 
i j 
第 1 次 交换 后 [ 40* 9 6&2 87 7B 05 32 GP 
i j 
i 向 右 于 | 描 [ 40* 40 学 87 78 o 32 GD) 
第 2 次 交换 后 ，i 向 左 #l 描 [ 40* 40 S 87 78 05 z 62 ] 
i A j 
IKM, ikti | 40* 40 62 y 78- W 9 62 ] 
i ¢ > Ny j 
第 4 次 交换 后 [ 40* 40 32 全 05 87 62] 
< 4 
XP 
第 5 次 交换 后 [ 40* po 05 78 @> 87 62: J 
x} i 4 
第 6 次 交换 后 Le o 32 “p 78 87 62] 
M,N Sil 
he waa 
Ge ey [SI Oy 2 05 32 40] 
Ne fatar [40* 40.532 05] 51 [78 87 62] 
2G [40* 40 32 0 51 [62] 78 [87] 
SAHE [05] 40 32] 40* 51 62 78 87] 
AHE OS] 32 [40] 4* 51 62 78 87] 
WAH 05 32 40 40* 51 62 78 87 
(b) 各 趟 排序 后 的 状态 
图 8.4 快速 排序 过 程 


划 





对 快速 排序 的 性 能 做 分 析 : 最 坏 情 况 是 每 次 划分 选取 的 基准 都 是 当前 无 序 
最 小 (或 最 大 ) 的 记录 ， 划 分 的 结果 是 基准 左边 的 无 序 子 区 为 空 (或 右边 的 无 序 子 


区 中 关键 字 
区 为 空 )， 而 











分 所 得 的 另 一 个 非 空 的 无 序 子 区 中 记录 数目 ， 仅 仅 比 划分 前 的 无 序 区 中 记录 个 数 减 少 1 











此 ， 快 速 排序 必须 做 n-1 趟 ， 每 趟 需 进行 mi 次 比较 ， 故 总 的 比较 次 数 达 到 最 大 值 : 


= nD/2=00) 
显然 ， 如 果 按 上 面 给 出 划分 算法 ， 每 次 取 当 前 无 序 





区 的 第 一 个 记录 为 基准 ， 那 么 当 文 
件 的 记录 已 按 递 增 序 ( 或 递减 序 ) 排 序 时 ， 每 次 划分 所 取 的 基准 就 是 当前 无 序 





区 中 关键 字 最 


数据 结构 (C 语言 版 ) ( ”) 


en sel 


小 (或 最 大 ) 的 记录 ， 则 快速 排序 所 需 的 比较 次 数 反 而 最 多 。 
在 最 好 情况 下 ， 每 次 划分 所 取 的 基准 都 是 当前 无 序 区 的 “中 值 ”记录 ， 划 分 的 结果 是 
基准 的 左 、 右 两 个 无 序 子 区 的 长 度 大 致 相等 。 设 C(n) 表 示 对 长 度 为 n 的 文件 进行 快速 排序 
所 需 的 比较 次 数 ， 显 然 ， 它 应 该 等 于 长 度 为 n 的 无 序 区 进行 划分 所 需 的 比较 次 数 n1 加 上 
递归 地 对 划分 所 得 的 左 、 右 两 个 无 序 子 区 (长 度 <<m/2) 进 行 快速 排序 所 需 的 比较 次 数 。 假 设 
文件 长 度 n=2* ， 那 么 总 的 比较 次 数 为 : 
C(n) <n+2C(n/2) 
<n+2[n/2+2C(n/2?)| =2n + 4C(n/ 2?) 
<2n+ 4[n/4 + 2C(n/2°)] =3n + 8C(n/2') 























= ..ssoe 
< kn+2*C(n/2°)=nlog, n+nC(1) 
= O(nlog, n) A 
TER: 式 中 C(1) 为 一 个 常数 ， 全 log,n。 NA 
因为 快速 排序 的 记录 移动 次 数 不 大 于 比较 的 次 数 ， ， 快 速 排 序 的 最 坏 时 间 复 杂 度 应 为 




















O(n,)， 最 好 时 间 复 杂 度 为 O(nlogy) « rs “er 人 可 采用 “三 者 取 中 ” 
的 规则 , 即 在 每 一 趟 划分 开始 前 , 首先 比较 me Key, Rlhigh]. key Ail R[| (low + high)/2 |]-key, 
令 三 者 中 取 中 值 的 记录 和 R[low] 交 换 。 
可 以 证 明 : 快速 排序 的 平均 时 间 Onlogz)， 它 是 目前 大 比较 的 内 部 排序 
方法 中 速度 最 快 的 ， 快 速 排序 亦 因此 而 得 名 

快速 排序 需要 一 个 栈 空间 来 实现 递归 。 RT 文件 均匀 分 割 为 两 部 分 ， 则 
栈 的 最 大 深度 为 |logyn ae ie li 递归 深度 为 mw MR 

空间 为 O(n)。 

ee aid enn < 


8.4 选择 排序 





选择 排序 (Selection Sorb 的 基本 方法 : 每 一 趟 从 待 排序 的 记录 中 选 出 关键 字 最 小 的 记 
录 ， 顺 序 放 在 已 排 好 序 的 子 文件 的 最 后 ， 直 到 全 部 记录 排序 完毕 为 止 。 本 节 介绍 两 种 选择 
FEAR: 直接 选择 排序 和 堆 排序 。 


8.4.1 直接 选择 排序 


直接 选择 排序 〈StraightSelectionSort) 的 基本 思想 是 : 第 一 趟 排序 是 在 无 序 区 R[0] 到 
R[z-H 中 选 出 最 小 的 记录 ， 将 它 与 R[0] 交 换 ， 第 二 趟 排序 是 无 序 区 R[1] 到 R[n-1] 中 选 关 键 
字 最 小 的 记录 , 将 它 与 R[1] 交 换 ; 而 第 i HEF ROJE R[i-2] 已 是 有 序 区 , 在 当前 的 无 序 
区 R[i-1] 到 R[n-1] 中 选 出 关键 字 最 小 的 记录 R[ 和 ， 将 它 与 无 序 区 中 第 1 个 记录 REIZ M, 
使 R[1] 到 R[ 语 1] 变 为 新 的 有 序 区 。 因 为 每 趟 排序 都 使 有 序 区 中 增加 了 一 个 记录 ， 且 有 序 区 
中 的 记录 关键 字 不 大 于 无 序 区 中 记录 的 关键 字 ， 所 以 进行 n-1 趟 排序 后 ， 整 个 文件 就 是 递 
增 有 序 的 ， 直 接 选 择 排序 的 过 程 如 图 8.5 所 示 ， 图 中 方 括号 表示 无 序 区 。 


2) 












































6 pupa 








初始 关键 字 [52 40 68 95 79 10 28 5% 58 o 
4 
SBSH ARG 06 [0 68 9 79 10 28 5% 58 52] 
Ao 
第 2 趟 排序 后 06 10 ig 9 79 4 z 52* 58 52] 
第 3 趟 排序 后 06 10 28 [95 7 40 68 5% 58 52] 
4 
第 4 趟 排序 后 06 10 28 40 [9 95 68 52* 58 52] 
4 4 
第 5 趟 排序 后 06 10 28 40 5* [95 68 79 58 52] 
4 d 
第 6 趟 排序 后 06 10 28 40 52* 52 [68 79 58 95] 
Z 
BTE 06 10 28 40 52 52/58 <9 68 95] 


KS 
SEHEN 06 10 28 40 52* x 58 68 [79 95] 


HUGHES 06 10 28 40 SS 58 68 79 95 


图 8.5 * 
算法 8.5 mrar sAN 





显然 ， 无 论文 件 初始 状态 如 何 ， 在 第 i 趟 排序 中 选择 最 小 关键 字 的 记录 ， 需 做 n-1 次 
比较 ， 因 此 ， 总 的 比较 次 数 为 多 (1- 站 =n(n-D/2=O(7)。 至 于 记录 移动 次 数 ， 当 初始 文 


i=l 


件 为 正 序 时 ， 移 动 次 数 为 0， 文件 初 态 为 反 序 时 ， 每 趟 排序 均 要 执行 交换 操作 ， 所 以 ， 总 
的 移动 次 数 取 最 大 值 3(n-1)。 直 接 选 择 排序 的 平均 时 间 复 杂 度 为 O(n*) 。 
直接 选择 排序 是 不 稳定 的 ， 请 读者 自行 检验 ， 如 反例 有 2，2'，1。 


8.4.2 HEHE 


在 上 一 小 节 介绍 的 直接 选择 排序 中 ， 为 了 从 R[1] 到 R[n] 中 选 出 关键 字 最 小 的 记录 ， 必 
须 进行 n-1 次 比较 ， 然 后 在 R[2] 到 R[m] 选 出 关键 字 最 小 的 记录 ， 有 需要 做 n-2 次 比较 ， 事 
实 上 ， 后 面 这 n-2 次 比较 中 ， 有 许多 比较 可 能 在 前 面 的 mn-1 次 比较 中 已 经 做 过 ， 但 由 于 前 
一 趟 排序 时 未 保留 这 些 比 较 的 结果 ， 所 以 ， 后 一 趟 排序 时 又 重复 执行 了 这 些 比 较 操作 。 本 
小 节 介绍 的 堆 排序 (Heap Sorb 可 以 克服 这 一 缺点 。 

扒 排 序 是 一 种 树 形 选 择 排序 ， 它 的 特点 是 : 在 排序 过 程 中 ， 将 RSR EERE 
全 二 叉 树 顺 序 存储 结构 , 利用 完全 二 又 树 中 双亲 节点 和 孩子 节点 之 间 的 内 在 关系 (参见 6.2.3 























小 节 ) 来 选择 关键 字 最 小 的 记录 。 
首先 ， 引 出 堆 的 定义 ，n 个 关键 字 序 列 KI，K2，…，K 称 为 堆 ， 而 且 仅 当 该 序列 满足 
特性 ; f 
K<Ky 和 KS Kain <at> 
从 堆 的 定义 可 以 看 出 ， som Laman rien 树 : 树 中 任 一 非 叶 子 节点 


的 关键 字 均 小 于 或 等 于 它 的 孩子 节点 的 关键 字 。 AN FFF 12, 20, 45, 26, 35, 
85 就 是 一 个 堆 ， 它 所 对 的 完全 二 又 树 如 图 8.6 显然 ， 这 种 堆 中 根 节点 ( 称 为 堆 项 ) 的 
关键 字 最 小 ， 我 们 把 它 称 为 小 根 堆 。 Bt ae se auld 也 就 是 说 ， 
若 完全 二 又 树 中 任 一 非 叶 子 节点 的 关键 字 等 于 其 孩子 节点 的 关键 字 ， 则 称 之 为 大 根 
堆 ， 如 图 8.7 所 示 ， 大 根 堆 的 堆 也 。 显 然 ， re 棵 树 亦 是 堆 。 


RN, X ix 
a LS 


OP (a) 逻辑 结构 A (b) 存储 结构 
图 8.6 小 根 堆 示例 
76 


JÄ /DEEPTID 












27 18 12 
(a) 逻辑 结构 (b) 存储 结构 
图 8.7 大 根 堆 示 例 








堆 排 序 正 是 利用 小 根 堆 ( 或 大 根 堆 ) 来 选取 当前 无 序 区 中 关键 字 最 小 (或 最 大 ) 的 记录 实现 
排序 的 。 我 们 不 妨 利用 大 根 堆 来 排序 。 每 一 趟 排序 的 基本 操作 如 下 : 将 当前 无 序 区 调整 为 一 
个 大 根 堆 时 ， 选 取 关键 字 最 大 的 堆 项 记录 ， 将 它 和 无 序 区 中 最 后 一 个 记录 交换 。 这 样 ， 正 好 
和 直接 选择 排序 相反 ， 有 序 区 是 在 原 记录 区 的 尾部 形成 并 逐渐 向 前 扩大 到 整个 记录 区 的 。 

堆 排 序 的 第 一 趟 排序 首先 需 “ 建 堆 ”, 即 把 整个 记录 数组 R[1] 到 R[n] 调 整 为 一 个 大 根 堆 ， 
所 以 ， 必 须 把 完全 二 又 树 中 以 每 一 个 节点 为 根 的 子 树 都 调整 为 堆 。 显 然 只 有 一 个 节点 的 树 
是 堆 ， 而 在 完全 二 又 树 中 ， 所 有 序列 i> Lm2 的 节点 都 是 叶子 ， 因此 ， 以 这 些 节 点 为 根 的 


S% 
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子 树 均 已 是 堆 。 这 样 ， 我 们 只 需 依次 将 以 序列 号 为 Law2」，Lm24-1，…，1， 的 节点 作为 


根 的 子 树 都 调整 为 堆 即 可 。 按 该 次 序 调整 每 个 节点 时 ， 其 左 、 右 子 树 均 已 是 堆 (不 妨 将 空 树 


看 作 堆 )。 
现在 的 问题 是 , 若 已 知 节点 RMAF 
也 调整 为 堆 ? 解决 这 一 问题 可 采用 “筛选 法 ” 














子 树 已 是 堆 ， 这 两 棵 子 树 的 根 分 别 是 各 自 子 树 中 的 最 大 关键 字 ， 所 以 ， 我 


它 的 左 、 右 孩子 中 选取 关键 字 最 大 的 节点 放 到 
最 大 者 ， 则 无 需 做 任何 调整 ， 以 RD 为 根 的 子 





键 字 的 左 孩子 R[2i] 或 R[2i+1] 进 行 交换 。 不 妨 设 R[2] 的 关键 字 最 大 ， 将 RA R[29] 交 换 位 


置 ， 交 换 之 后 有 可 能 导致 以 R[2i+1] 为 根 的 子 


是 堆 ， 于 是 可 重复 上 述 过 程 ， 将 以 RJAR 
下 去 ， 最 多 可 能 一 直 调 整 到 树叶 ， 最 终 把 最 4 
选择 上 来 。 








树 均 已 是 堆 , 如 何 将 以 R[] 为 根 的 完全 二 叉 桂 
。 筛 选 法 的 基本 思想 如 下 : 因为 R[] 的 左 、 右 
门 必须 在 R[] 和 
RIMMEL. 车 R 四 的 关键 字 已 是 三 者 中 的 
树 已 构成 堆 ; 否则 ， 必 须 将 R 中 和 具有 最 大 关 

















树 不 再 是 堆 ， 但 由 于 RD2 引 的 左 、 右 子 树 仍然 





4 子 树 调整 为 堆 ，…'*， 如 此 重复 ， 逐 层 弟 
\ 的 关键 字 筛选 下 去 /将 最 大 关键 字 一 层 层 地 


GANNAN 


图 8.8 阐明 了 对 于 关键 字 序 列 49，38，65，97, .04N 13, 27, 49*, 55, 76 在 建 堆 过 
其 存储 结构 的 变化 情况 ， 其 





程 中 完全 二 又 树 及 了 





(b) 54, 
K 





(d) 二 2， 交 换 38 和 04 


交换 57 和 49* 
> > 





(e) 天 1， 交 换 49 和 04 





EH nO HUAI 5 个 节点 起 进行 调整 。 






(E) 2, 28449 F138 


图 8.8 建 堆 过 程 


算法 8.6 ”筛选 算法 。 
void Sift(SeqList R, 
{ 


int i, int 


Sacia 
RecType temp; 
temp=R[i]; 
j=2*i; 

while (j<=m) 


/* 在 数组 R[i] 到 R[m] 中 ,调整 R[i] */ 


m) 


/* 以 RI[i] 为 根 的 完全 二 叉 树 构成 堆 */ 


/* jm,R[2*i] 是 R[i] 的 左 孩 子 */ 


数据 结构 (- 语言 版) ( 7 ) 


if((j<m) && (R[j].key<R[j+1] .key) j++; /* 了 指向 Ri] 的 右 孩子 */ 
if (temp. key<R[j] . key) /* 孩子 节点 关键 字 较 大 */ 
{ 





R[i]=R[j]; /* 将 R[j] 换 到 双亲 位 置 上 */ 
isje gesn /* 修改 当前 被 调整 节点 */ 
上 
else break; /* 调整 完毕 , 退出 循环 */ 
} 
R[i]=temp; /* 最 初 被 调整 节点 放 入 正确 位 置 */ 


} 
在 完全 二 又 树 中 ， 若 一 个 节点 没有 左 孩子 ， 则 该 节点 必 是 叶子 ， 因 此 ， 当 筛选 算法 中 
循环 条 件 /入 不成立 时， 则 表示 当前 调整 节点 RUPEE, AGREED. tE 
过 程 中 ， 若 当前 被 调整 节点 R[] 和 它 的 左 、 右 孩子 节点 aoe 孩子 RU] 的 关键 字 最 大 ， 























则 需要 交换 RD 和 R 四 的 位 置 ， 将 REE F ia vE REPEAT HER BCE IHF K, 
为 了 减少 记录 移动 次 数 ， 故 算法 在 筛选 开始 前 ; 被 刘坚 的 节点 RR 器 保存 在 temp 中 ， 当 
发 生 交换 时 ， 仅 需 将 R 四 放 入 其 双亲 节点 a 9 人 ， 而 REAR BRIA R 四 的 位 置 上 ， 


只 有 当 整 个 筛选 过 程 结束 时 ， We a AE e 
有 了 上 述 筛选 算法 ， me Sy ROJE! RÈR- AKRE, A FE 
实现 : 


; 


由 于 建 堆 的 结果 是 把 R[1] 到 R[n] 中 关键 字 的 记录 筛选 到 堆 顶 R[1] 的 位 置 上 ， 排 序 
后 这 个 关键 字 类 的 记录 应 该 是 记录 区 有 i 到 RE] 的 最 后 一 个 记录 ， 因 此 ， 将 R[1] 和 Rin) 
交换 后 便 得 到 予 第 一 趟 排序 的 结果 。 

第 二 趟 排序 的 操作 首先 是 将 当前 无 序 区 R[1] 到 R[n-1] 调 整 为 堆 . 因 为 第 一 趟 排序 后 , R[1] 
到 Rin) PRA R[1] 的 值 发 生 了 变化 ， 它 的 左 、 右 孩子 仍然 是 堆 ， 所 以 ， 我们 可 以 调用 Sift(R, 
1, n-1)# R[1] 到 RIn-1] 调 整 为 大 根 堆 ， 即 选 出 R[1] 到 R[n-1] 中 最 大 关键 字 放 入 堆 顶 。 然 后 ， 
将 堆 顶 记录 R[1] 和 当前 无 序 区 的 最 后 一 个 记录 R[n-1] 交 换 ， 其 结果 是 R[1] 到 R[n-2] 变 为 新 的 
无 序 区 ，R[n-1] 到 R[m] 为 有 序 区 ， 且 有 序 区 中 记录 的 关键 字 均 大 于 等 于 无 序 区 中 记录 的 关键 
字 。 如 此 重复 n-1 趟 排序 之 后 ， 就 使 有 序 区 扩充 到 整个 记录 区 R[1] 到 R[n]。 图 8.9 是 堆 排 序 
的 全 过 程 示例 ， 其 中 方 括号 里 面 的 记录 是 当前 的 无 序 区 。 

算法 8.7 堆 排 序 。 


void HeapSort (SeqList R) 
{ /* 对 R[1] 到 R[n] 进 行 堆 排 序 */ 


Int ir 


> 
for (i=n/2; ee fe VK 
sift aici ` 



























































RecType temp; 
for (i=n/2;i>=1;i--) /* 建 初始 堆 */ 
SFLURy ipn)? 


Qe 
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for (i=n;i>=1;i--) 


{ 


temp=R[1]; /* 当 前 堆 顶 记录 和 最 后 一 个 记录 交换 */ 
R[1]=R[i]; 
R[i]=temp; 


Sift(R,1,i-1);  /*R[1] 到 R[i-1] 重 建成 堆 */ 








(a) 输 山 04， 将 76 移 全 堆 项 ， 重 新 整 堆 (oy uli) 将 55 移 全 堆 顶 ， 重 新 整 堆 
1 1 \ 1 1 
* ES SE ~ BP 
©) Gs) Cg CD GIGI CO -CD GIGS 67) QO) 
4 5. 6 7 4 N 6 V9 i 4 5 6 4 5 6 
OHN, KORET, EDE (DAMNIS, MTOE, ENNE 
1 vA 1 Nani 1 
(65) CAN) 9) 65 
og 9 Go 一 oo 
DU) AT WO x C7 
45 Wy 4 5 SS 4 4 
ONAN HOSEA, A (0 输出 49， 将 76 移 全 堆 顶 ， 重 新 整 堆 
1 1 1 1 
a 
= o% o = o > 
2 3 2 3 2 2 
(g) 输 山 55， 将 97 移 至 堆 顶 ， 和 到 新 整 堆 (h) 输出 65，76，97 


图 8.9 堆 排序 过 程 
堆 排序 的 时 间 主 要 由 建立 初始 堆 和 不 断 重建 这 两 部 分 的 时 间 开销 构成 。 建 立 初 始 堆 共 
调用 了 Sift 过 程 | (n/2) 次， 每 次 均 是 将 R[] 为 根 (|[n/2 | 三 i 三 1) 的 子 树 调整 为 堆 。 显 然 ， 
具有 nn 个 节点 的 完全 二 叉 树 深度 是 h=| log n |+1, 故 节点 RG](|n/2| 宇 i 三 1) 的 层 数 只 可 能 
FÆ h1, hr2,…, 1。 由 于 第 1 层 上 的 节点 个 数 至 多 为 2 , 故 以 它们 为 根 的 子 树 深度 为 hr[-1。 
而 Sift 算法 对 深度 为 完全 二 叉 树 所 进行 的 关键 字 比 较 次 数 ， 至 多 为 Wei, Alt, Æ 
初始 堆 调 用 Sift 算法 所 进行 的 关键 字 比 较 的 总 次 数 ， 不 超过 Ci(n)， 且 它 满足 下 式 : 













































































Gm = D2" X20-D 


¥ 2x1 


=2"'4+2"?K242"9X34+--4+2X(h-D 
=2'(1/2+2/2?+3/2>--+(h-1)/2'") 
<2'X2<2x 7'log"1 = an 

=O(n) 

第 j 次 重建 堆 时 ， 堆 中 有 ny SAD, TEES REA [log (n- +1, WA Sift E 
建 堆 所 需 的 比较 次 数 至 多 为 2X[log(z- f)] 。 因 此 ,xz-1 趟 排序 过 程 中 重建 堆 的 比较 总 次 数 
不 超过 Cs(n), H 

Cxln) =2X ({log,(n—1)] + [log,(n—2)]+- abea 
<2n[log;] 从 
= O(nlog,n) AD 

在 sit 算法 中 ， 记 录 移 动 次 数 不 会 超过 el 因此 ， 堆 排序 的 时 间 复 杂 度 是 

O(n + nlog,n) = O(nlog,n) o 


由 于 建 初始 堆 所 需 的 比较 次 数 较 多 ek DO ETERRA, HEHE 
序 是 我 们 介绍 aan. dogy) 的 排序 算法 ,辅助 存储 空间 仅 为 用 于 交换 


的 记录 空间 。 5 
堆 排序 是 不 稳定 的 ， ine eis. xis 
25 Rm NERE 系统 
RY’ 
() Be Ry 4 
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(2) 主 程序 代码 如 下 





数据 结构 ( 语言 版 ) 








数据 结构 ( 语言 版 ) 








数据 结构 (C 语言 版 ) 
oi aaa 








数据 结构 ( 语言 版 ) 
一 ia a 





1 
output (L); 
printf ("排序 完 ! 所 用 时 间 time=%.31£\n", (time2-timel)); 
printf (" 按 任意 键 返 回 ~~\n"); 
getch(); 
} 





void main() 

{ 
CountryList countrylist; 
FCreat (&countrylist) ; 
WeightSumComp (&countrylist) ; 
while (1) 


select1 (&countrylist) ; «ch 
SS 
OC axon 人 


请 读者 对 上 述 程序 diae. ci 算 功能 进行 改进 ， 
s R 


本 章 主 要 讨论 各 种 snr ona Ri oa, 并 对 这 些 排序 算法 的 稳定 
性 和 复杂 性 进行 了 较为 详尽 的 分 析 。 可 以 看 出 八 每 一 种 排序 方法 都 有 其 优 缺 点 ， 有 其 本 身 


适用 的 场合 ee 














在 选择 排序 方法 时 ， 有 下 列 几 种 选择 : 
(1) 车 待 排序 的 记录 个 数 n 值 较 小 ， 可 以 选用 直接 插入 排序 法 ， 但 是 车 记录 所 含 数 据 
项 较 多 ， 所 占 存储 量 较 大 时 ， 应 选用 直接 选择 排序 法 。 反 之 ， 若 待 排序 的 记录 个 数 n 值 较 
大 时 ， 应 选用 快速 排序 法 。 
D 快速 排序 在 值 较 小 时 的 性 能 不 及 直接 择 入 排序 ， 因 此 在 实际 应 用 中 ， 可 将 它 和 直 
接 插入 排序 混合 使 用 。 如 在 快速 排序 划分 子 区 间 的 长 度 小 于 某 值 时 , 转 而 调用 直接 插入 排序 。 
(3) 车 待 排序 序列 总 是 基本 有 序 ， 用 冒 泡 排序 、 简 单 选择 排序 或 直接 插入 排序 更 适合 ， 
不 适合 用 快速 排序 。 















































J 题 
一 、 填 空 题 
1. 大 多 数 排序 算法 都 有 两 个 基本 的 操作 : 和 
. 在 对 一 组 记录 (54，38，96，23，15，72，60，45， 到 各 行 直接 插入 排序 时 ， xE 
EA 表 时 ， 为 寻找 插入 位 置 至 少 需 比较 次 。 
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数据 结构 (C 语言 版 ) O) 


ee ee E 5 d 























3. 在 插入 和 选择 排序 中 ， 若 初始 数据 基本 正 序 ， 则 选用 o 若 初始 数据 基本 反 
序 ， 则 选用 

4. 在 堆 排序 和 快速 排序 中 ， 若 初始 记录 接近 正 序 或 反 序 ， 则 选用 ; 车 初始 记 
录 基 本 无 序 ， 则 最 好 选用 

5. 对 于 个 记录 的 集合 进行 冒 泡 排序 ,在 最 坏 的 情况 下 所 需要 的 时 间 是 T 





对 其 进行 快速 排序 ， 在 最 坏 的 情况 下 所 需要 的 时 间 是 
6. 设 要 将 序列 (Q，H，C，Y，P，A，M，S，R，D，F，X) 中 的 关键 码 按 字 母 序 的 升 
序 重新 排列 ， 则 冒 泡 排序 一 趟 扫描 的 结果 是 : 
初始 步 长 为 4 的 希 尔 排序 一 趟 的 结果 是 
快速 排序 一 趟 扫描 的 结果 是 o 
堆 排序 初始 建 堆 的 结果 是 


判断 题 
A 
.用 希 尔 方 法 排序 时 ， sept eet, 











1 ©) 
2， 堆 排序 所 需要 附加 空间 数 与 待 排序 的 记录 个 ©) 
3. Ab n MERIR AETR EERTE O(nlogzn)。 ( ) 
4. Ra en a AND 而 且 所 需 附加 空间 也 最 少 。  (  ) 
5， 对 一 个 堆 ， 按 二 叉 树 层次 进行 首 房 可 以 得 到 一 个 有 序 序列 。 ©) 
6. 对 于 个人 ， 所 月 的 平均 时 间 是 O0)。 ©) 
三 、 选 择 是 
eames 至 多 需要 
A. 8 D. 25 


2. HERR ITY See ee annua 
行 比较 ， 已 排序 序列 的 正确 位 置 上 的 方法 称 为 ( e 
希 尔 排序 B. 冒 泡 排序 cC. 插入 排序 D. 选择 排序 
3. peace) 并 将 其 依次 插入 已 排序 序列 (初始 时 为 空 ) 的 一 端的 方法 


MAC )。 

A. 希 尔 排序 B. HHF C. 插入 排序 D. 选择 排序 

4. 对 nn 个 不 同 的 排序 码 进行 冒 泡 排序 ， 在 下 列 情况 下 比较 的 次 数 最 多 的 是 (。”)。 
A. 从 小 到 大 排列 好 的 B. 从 大 到 小 排列 好 的 
C. 元 素 无 序 D. 元 素 基本 有 序 

5. 对 个 不 同 的 排序 码 进行 冒 泡 排序 ， 在 元 素 无 序 的 情况 下 比较 的 次 数 为 ( e 
A. ntl B.n Cc. nl D. n(n-1)/2 

6. 快速 排序 在 下 列 情 况 下 最 易 发 挥 其 长 处 的 是 ( )o 
A. 被 排序 的 数据 中 含有 多 个 相同 排序 码 
B. 被 排序 的 数据 已 基本 有 序 
C. 被 排序 的 数据 完全 无 序 
D. 被 排序 的 数据 中 的 最 大 值 和 最 小 值 相 差 悬 殊 
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© -一 ais) 
7. 对 及 n 个 记录 的 表 做 快速 排序 ， 在 最 坏 情 况 下 ， 算 法 的 时 间 复 杂 度 是 (。” )。 
A. O(n) B. O(n’) C. Olnlogn) D. Oò) 
8. 若 一 组 记录 的 排序 码 为 46，79，56，38，40，84)， 则 利用 快速 排序 的 方法 ， 以 第 














一 个 记录 为 基准 得 到 的 一 次 划分 结果 为 ( o 





A. 38, 40, 46, 56, 79, 84 B. 40, 38, 46, 79, 56, 84 
C. 40, 38, 46, 56, 79, 84 D. 40, 38, 46, 84, 56, 79 
9. 下 列 关键 字 序列 中 ，( 。 “”) 是 堆 。 
A. 16, 72, 31, 23, 94, 53 B. 94, 23, 31, 72, 16, 53 
C. 16, 53, 23, 94, 31, 72 D. 16, 23, 53, 31, 94, 72 
10. 堆 是 一 种 ( HEF. 
A. 插入 B. 选择 C. 交换 D. 归并 
11， 堆 的 形状 是 一 棵 ( 。 )。 -| 从 





A. 二 又 排序 树 B. 满 二 又 树 ©: ESN . 平衡 二 又 树 
12. 若 一 组 记录 的 排序 码 为 (46，79，56，38， , 则 利用 堆 排 序 的 方法 建立 的 
初始 堆 为 (””)。 
A. 79, 46, 56, 38, 40, 84 a 79, 56, 38, 40, 46 
C. 84, 79, 56, 46, 40, 


Pe, Xo 84, 56, 79, 40, 46, 38 
13. 下 述 几 种 排序 方法 中 ， Z 


A. 插入 排序 B， 快速 i wit D. 选择 排序 
17 
mn, E Y 党 
四 、 应 用 是 MK iM x 


ii; EARRINGS 82 105, 71, on 82'，12，55}， 分 别 写 出 直接 插 
入 排序 、 BASH s, 3, 1), mic 速 排序 、 直 接 选择 排序 、 堆 排序 的 各 趟 
运行 结果 。 

2. 以 单 存储 结 构 实现 直接 插入 排序 的 算法 ， 

3. 修改 冒 泡 排序 算法 ， 以 交替 的 正 、 反 两 个 方向 进行 扫描 。 即 第 一 趟 把 排序 码 最 大 的 
记录 放 到 最 末尾 ， 第 二 趟 把 排序 码 最 小 的 记录 放 到 最 前 面 。 如 此 反复 进行 直到 排序 完成 。 

4. 以 单 链表 为 存储 结构 ， 写 一 个 直接 选择 排序 算法 。 

5. 一 个 线性 表 中 的 元 素 为 正 整 数 或 负 整 数 ， 设 计 一 个 算法 ， 将 正 整 数 和 负 整 数 分 开 ， 
使 线性 表 的 前 部 为 负 整数 ， 后 部 为 正 整数 ， 不 要 求 都 它们 排序 ， 但 要 求 尽量 减少 交换 次 数 。 
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查 R 
AE amsa 


电话 号 码 查询 系统 LR 
KNN 
人 们 在 日 常生 活 中 经 常 需要 查询 茶 个 人 或 菜 个 单位 的 电话 号 码 ， 一 个 简单 、 易 用 、 快 
捷 的 电话 号 码 查询 系统 能 给 人 们 生活 带 来 极 大 地 方便 ,要 求实 现 一 个 简单 的 个 人 电话 号 码 
查找 系统 ， 根 据 用 户 输 入 的 信息 (如 姓名 等 ) 进 行 决 速 查询 ， 要 求 能 够 完成 号 码 的 录入 和 查 
找 功能 。 每 个 记录 有 电话 号 码 、 用 户 名 和 地 泪 3 个 信息 。 
ASJ 


ZN 


>) pee, x a 
EREET SREE, REEE, ARORO AEE A 
一 种 操作 ， 几 乎 在 任何 一 个 计算 机 系统 软件 和 应 用 软件 中 都 会 涉及 ， 当 问题 所 涉及 的 数据 
归 相 当 大 时 ， 直 并 人 的 和 玉昌 格外 各， 在 此 实时 应 千 系统 中 人 其 硬 要 ， 因 此 有 
必要 掌握 一 些 常用 的 查找 方法 ， 并 通过 对 它们 的 效率 分 析 来 比较 各 种 查找 方法 的 优 劣 。 
在 计算 机 领域 中 ,“ 查 找 ” 有 明确 而 严格 的 定义 ， 下 面 给 出 有 关 的 概念 。 
查找 表 (Search Table): 由 同一 类 型 的 数据 元 素 (或 记录 ) 构 成 的 集合 ， 即 查找 表 中 的 数据 
元 素 具 有 相同 的 类 型 。 根据 对 查找 表 的 操作 不 同 分 类 , 查找 表 分 为 静态 查找 表 和 动态 查找 表 。 
静态 查找 表 (Static Search Table)， 若 只 对 查找 表 进行 查询 (查询 某 个 “特定 的 ”数据 元 素 是 
否 在 查找 表 中 ) 和 检索 (获取 指定 数据 元 素 的 各 种 信息 ) 操 作 ， 则 这 类 查找 表 称 为 静态 查找 表 。 
动态 查找 表 (Dynamic Search Table): 若 在 查找 过 程 中 同时 插入 查找 表 中 不 存在 的 数据 
元 素 ， 或 者 从 表 中 删除 已 经 存在 的 某 个 数据 元 素 ， 则 这 类 查找 表 称 为 动态 查找 表 。 
关键 字 (Key): 数据 元 素 中 某 个 数据 项 的 值 ， 又 称 为 键 值 ,可 以 用 米 标 识 一 个 数据 元 素 。 
关键 码 ; 关键 字 所 在 的 某 个 数据 项 (或 称 字段)。 
主 关键 字 ; 能 够 唯一 标识 数据 元 素 (或 记录 ) 的 关键 字 。 
次 关键 字 ， 不 能 够 唯一 标识 数据 元 素 (或 记录 ) 的 关键 字 。 例 如 ， 在 电话 号 码 本 中 ， 能 
够 唯一 标识 一 条 记录 的 是 电话 号 码 ， 即 主 关键 字 ， 而 用 户 名 或 地 址 均 不 能 唯一 标识 一 条 记 
录 ， 因 此 它们 是 次 关键 字 。 
查找 (Searching)。 在 含有 条 记录 的 表 中 找 出 关键 字 等 于 给 定 值 K 的 数据 元 素 (记录 )。 
若 找 到 ， 则 查找 成 功 ， 返 回 该 记录 的 信息 或 该 记录 在 表 中 的 位 置 ， 否 则 查找 失败 ， 返 回 相 
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关 的 指示 信息 。 


为 查找 是 对 已 存 入 计算 机 中 的 数据 所 进行 的 操作 ， 所 以 采用 何 种 查找 方法 ， 首 先 取 
决 于 使 用 哪 种 数据 结构 来 表示 “ 表 ”， 即 表 中 节点 是 何 种 方式 组 织 的 ， 为 了 提高 查找 速度 ， 
我 们 常常 用 某 些 特殊 的 数据 结构 来 组 织 表 。 因 此 ， 在 研究 各 种 查找 方法 时 ， 首 先 必须 弄 清 
这 些 方法 所 需要 的 数据 结构 ， 特 别 是 存储 结构 。 

和 排序 类 似 ， 查 找 也 有 内 查找 和 外 查找 之 分 。 若 整个 查找 过 程 都 在 内 存 中 进行 ， 则 称 
之 为 内 查找 ;反之 ， 若 查找 过 程 中 需要 访问 外 存 ， 则 称 之 为 外 查找 。 

于 查找 运算 的 主要 操作 是 关键 字 的 比较 ， 所 以 ， 通 常 将 查找 过 程 中 对 关键 字 需 要 执 
行 的 平均 比较 次 数 (也 称 平均 查找 长 度 ) 作 为 衡量 一 个 查找 算法 效率 优 劣 的 标准 。 平 均 查 找 
长 度 (Average Search Length，ASL) 定 义 为 : 


ASL= > De, 入 (9.1) 
式 中 : n 是 节点 的 个 数 ， pi; 是 查找 第 i 个 节点 的 概率 ， aie 均 认 为 每 个 节点 的 查 
找 概率 相等 ， 即 ppp ln ci EREB i Ag A 的 比较 次 数 。 


pe 


9.2 线性 天 查找 

tenanan tate RN, A 
方法 ， 它 们 分 别 是 顺序 查找 、 二 分 过 并 分 块 查找 。 2 
9.2.1 顺序 查找 a Xa 

顺序 查找 是 一 种 最 简章 的 查找 方法 。 它 的 基本 思想 如 下 ;从 表 的 一 端 开 始 ， 顺 序 扫描 
线性 表 ， 依 次 提 撕 到 的 节点 关键 字 和 给 定 值 六 相 比较 ， 若 当前 扫描 到 的 节点 关键 字 与 
等 ， 则 查 车 扫描 结束 后 ， 仍 未 找到 关键 字 等 于 的 节点 ， 则 查找 失败 。 

假设 查找 表 中 的 关键 字 为 {34，44，43，12，53，55，73，64，77}， 如 果 待 查 关 键 字 
为 64， 则 从 34 开始 向 后 比较 ， 比 较 到 64 时 查找 成 功 ， 或 从 77 开始 向 前 比较 ， 比 较 到 64 
时 查找 成 功 。 而 若 查找 关键 字 为 88， 则 从 34 开始 向 后 或 从 77 开始 向 前 比较 ， 比 较 完 所 有 
元 素 后 都 没有 找到 相等 的 记录 ， 查 找 失败 。 

顺序 查找 方法 既 适 用 于 线性 表 的 顺序 存储 结构 ， 也 适用 于 线性 表 的 链 式 存储 结构 。 使 
单 链表 做 存储 结构 时 ， 扫 描 必 须 从 第 一 个 节点 开始 往 后 扫描 。 下 面 只 介绍 以 数组 做 存储 
结构 时 的 顺序 查找 ， 类 型 说 明和 具体 算法 如 下 。 


typedef struct{ 
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KeyType key; /*KeyType 由 用 户 定义 */ 
InfoType otherinfo; /* 此 类 型 依赖 于 应 用 */ 
}NodeType; 


typedef NodeType Sqlist[n+1]; 
算法 9.1 顺序 查找 算法 。 


int SqSearch(Sqlist R,KeyType K) 
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{/* 在 顺序 表 RI[1. .n] 中 顺序 查找 关键 字 为 K 的 记录 */ 
/* 成 功 时 返回 找到 的 记录 位 置 , 失败 时 返回 0*/ 
int iz 
R[0] .key=K; /* 在 0 位 置 设置 监视 哨 */ 
for(i=n;R[i].key!=K;i--); ”/* 从 表 后 往 前 找 */ 
return i; 


PE AAO, 表示 查找 失败 , AM R[i] 为 要 找 的 记录 */ 





} 

算法 中 监视 哨 R[0] 的 作用 仍然 是 在 for 循环 中 省 去 判定 防止 下 标 越 界 的 条 件 IS 1, MA 

而 节省 比较 的 时 间 。 若 从 后 向 前 扫描 完整 个 表 后 ， 都 未 找到 关键 字 为 天 的 节点 ， an 
终止 于 R[0].key=K， 此 时 返回 的 函数 值 为 0， 这 意味 着 查找 失败 ; 若 for 循环 终止 时 ,i 

则 查找 成 功 。 显然 , 若 找到 的 是 Rin], 则 比较 次 数 cu=1; aoe WE 














一 般 情况 下 ，cazn-it1， 因 此 ， 在 等 概率 假设 下 ， 顺 序 查找 长 度 为 : 
ASL sg= Èr raea (9.2) 


也 就 是 说 ， I PIS HIRE ee Gee ce 
行 nt1 次 比较 之 后 才能 确定 查找 失败 。 

ae 因此 ， 查 找 长 度 的 数量 级 就 是 查找 算 
法 的 时 间 复杂 度 ， 记 为 O(n)。 S< 

有 时 ， 表 中 各 节点 的 查找 概 兴 并 不 机 等 ， 例 如 ， 在 和 全体 学 生 的 病历 档案 组 成 的 线性 
表 中 ， 体 弱 多 病 学 生 的 病历 的 次 emt 的 查找 概率 。 在 不 等 概率 的 
情况 下 ， 顺 序 查找 的 平均 查找 长 度 为 ; 





~~ ASL'sq=prt2p2t = nt NPn 

显然 ， 4 p, Spr maL pi INS ASL sg 1 因此 ， 若 事先 知道 表 中 各 节点 的 查找 
概率 不 相等 和 mn AHR 则 应 将 表 中 节点 按 查 找 概率 由 大 到 小 的 顺序 存放 ， 以 便 提 
高 顺序 查找 的 效率 。 然 而 ， 在 一 般 情 况 下 ， 各 节点 的 查找 概率 无 法 事先 确定 。 为 了 提高 查 
找 效率 ， 我 们 可 以 对 算法 SeqSearch 做 如 下 修改 : 每 当 查 找 成 功 时 ， 就 将 找到 的 节点 和 其 
后 继 节 点 ( 若 存在 ) 交 换 。 这 样 ， 使 得 查找 概率 大 的 节点 在 查找 过 程 中 不 断 往 后 移 ， 便 于 在 
以 后 的 查找 中 减少 比较 次 数 。 

顺序 查找 的 优点 是 算法 简单 ， 且 对 表 的 结构 无 任何 要 求 ， 无 论 是 用 数组 还 是 用 链表 来 
存放 节点 ， 也 无 论 节点 之 间 是 否 按 关键 字 有 序 或 无 序 ， 它 都 同样 适用 。 顺 序 查找 的 缺点 是 
查找 效率 较 低 ， 特 别 是 当 n 较 大 时 ， 不 宜 采用 顺序 查找 。 


9.2.2 ”二 分 查找 


二 分 查找 (Binary Search) 又 称 折 半 查找 , 它 是 一 种 效率 较 高 的 查找 方法 。 但 是 ， 二 分 查找 
有 一 定 的 条 件 限 制 : 要 求 线性 表 必 须 采 用 顺序 存储 结构 , 而 且 表 中 元 素 必须 按 关 键 字 有 序 ( 升 
序 或 降序 均 可 )， 即 要 求 线性 表 是 有 序 表 。 在 下 面 的 讨论 中 ， 不 妨 设 有 序 表 是 递增 有 序 的 。 

二 分 查找 的 基本 思想 : 首先 将 待 查 的 天 值 和 有 序 表 R[0] 到 RD-1] 的 中 间 位 置 mid 上 的 节 
点 的 关键 字 进 行 比较 ， 若 相等 ， 则 查找 完成 ， 返 回 此 位 置 的 值 ; 若 RImid].key>K， 则 说 明 待 
查找 的 节点 只 可 能 在 左 子 表 R[0] 到 R[mid-1] 中 ， 下 面 只 要 在 左 子 表 中 继续 进行 二 分 查找 ， 若 
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© 
R[mid].key<K， 则 说 明 待 查找 的 节点 只 可 能 在 右 子 表 R[ mid +1] 8) Rin- 
中 继续 进行 二 分 查找 。 这 样 ， 经 过 一 次 关键 字 比 较 就 缩小 一 半 的 查找 
找 过 程 ， 直 到 找到 关键 字 为 的 节点 ， 或 者 当前 的 查找 








区 间 。 不 断 重复 上 述 查 
区 间 为 空 (表示 查找 失败 )。 








1] 中 ， 








此 要 在 右 子 表 








如 果 分 别 用 low 和 high 来 表示 当前 查找 区 问 的 下 界 (第 一 个 记录 
个 记录 的 位 置 )， 则 该 区 间 的 中 点 位 置 mid = MH 


例如 ， 假 设 被 查找 的 有 序 表 中 关键 字 序列 为 : 
06, 15, 20, 22, 38, 57, 65, 76, 81, 





90, 95 


的 位 置 ) 和 上 界 (] 





最 后 一 





所 示 。 


t low>high, |x |e] 4s 


当 给 定 的 K 值 分 别 为 22 和 85 时 ， 进 行 二 分 查找 的 过 程 如 图 9.1 
1 2 2 s S 6 F 8 9 wn 
[06 15 20 22 38 57 65 7 81 90 95] 
d, mid Js 
R[mid].key>k etx 

人 15 + 22 38 57 65 76 8I < 站 95] 

low mid high 7 K} 

R[mid].key>k SX y- 
[06 15 20 22 38 57 :区 ”81 9% 95] 
l K j 
low mid high Se 
R[mid].k SN 
(a) ERRINA 较 3 次 ， + ee 
i Bo 3 We > ay 
[06 15 x 22”38 16 8T S S 
t jc A 1 
low “< — high 
pa R[mid].ke 

te 5 20 22 38 57- a 76 81 90 95] 
: t t t 
low mid high 

RImid].key<k 
[06 15 20 22 38 57 65 76 81 9% 95] 
Jow mid high 
RImid].key>k 
[6 15 20 22 38 57 65 76 81 90 95] 
high low 存在， 


(b) 查找 K=85 的 过 程 ( 比 较 3 次 后 查找 失败 ) 
图 9.1 二 分 查找 过 程 示例 

二 分 查找 算法 的 代码 实现 如 下 。 

算法 9.2 二 分 查找 算法 。 


int BinSearch(SeqList R,KeyType K) 


个 找 失败 ! 


/* 在 有 序 表 R 中 进行 二 分 查找 ,成 功 时 返回 节点 的 位 置 , 失败 时 返回 -1 */ 
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数据 结构 BERD C ”) 


{ 
int low, mid, high; 
low=0; high=n-1; /* 置 查找 区 间 的 下 、 上 界 初 值 */ 
while (low<=high) /* 当前 查找 区 间 非 空 */ 
mid=(lowthigh) /2; 
if (K= =R[mid] .key) 
return mid; /* 查找 成 功 返 回 */ 
if (K<R[mid] .key) 
high=mid-1; /* 缩小 查找 区 间 为 左 子 表 */ 
else low=mid+1; /* 缩小 查找 区 间 为 右 子 表 */ 





} 


return (-1) ; /* 查找 失败 */ 
Vi 

二 分 查找 过 程 可 用 二 叉 树 来 描述 ， TMF ruse 上 的 节点 作为 根 ， 
左 半 区 间 和 右 半 区 间 中 的 节点 分 别 作 为 根 的 左 子 树 左 半 区 间 和 右 半 区 间 再 按 类 
似 的 方法 类 推 ， 由 此 得 到 的 二 叉 树 ， 称 为 描述 二 判定 树 (Decision Tree). 

例如 ， 上 述 具 有 11 个 节点 的 有 序 表 可 b 示 的 判定 树 表 示 ， 树 中 节点 内 的 数 
字 表 示 该 节点 在 有 序 表 中 的 位 置 。 若 查找 a heeds a a 次 比较 ; 
acon rR 2 eB 进行 两 次 比较 ; 查找 第 1、 、10 个 节点 
需要 比较 三 次 ， 查 找 第 2、5 sabe apnea 由 此 可 见 ， Bea 














是 一 条 从 判定 树 的 根 到 被 查 节点 的 路 径 , 经 历 比较 的 关键 怡 为 该 节点 在 树 中 的 层 数 。 
ARAM, N M RRDA ENEAN 点 ( 非 表 中 节点 ) 的 路 径 ， 所 需 
cis «mes ty 


WP, 





图 9.2 具有 11 个 节点 时 二 分 查找 的 判定 树 
用 图 9.2 所 示 判 定 树 描述 图 9.1(a) 查 找 K=22 的 过 程 时 ， 所 经 历 的 比较 路 径 如 图 9.2 中 

















虚线 所 示 ， 查 找 过 程 将 K 分 别 与 节点 6、3 和 4( 即 关键 字 57、20 和 22) 比 较 ， 共 进行 了 三 
次 比较 后 才 查 找 成 功 。 要 查找 K=85 的 记录 ， 所 经 过 的 内 部 节点 为 6、9、10， 最 后 达到 外 
部 节点 ， 表 明 查 找 失 败 ， 其 比较 次 数 为 三 次 。 

借助 于 二 分 查找 判定 树 ， 我 们 很 容易 求 得 二 分 查找 的 平均 查找 长 度 。 设 节点 总 数 
7=2 包 1， 则 判定 树 是 深度 为 h=logz(n+1) 的 满 二 叉 树 , 树 中 第 基层 上 的 节点 个 数 为 2*1， 查 找 
它们 所 需 的 比较 次 数 是 ， 因 此 ， 在 等 概率 假设 下 ， 二 分 查找 的 平均 查找 长 度 为 : 


ASLn= pe, = Ye /n= Dk Xn(ntl)*log(ntl)-1)/n (9.3) 
isl isl k=l 
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当 n 很 大 时 ， 可 使 用 近似 公式 : 
ASLp=log(n+1)-1 (9.4) 
作为 二 分 查找 的 平均 查找 长 度 。 二 分 查找 在 查找 失败 时 所 需 比 较 的 关键 字 个 数 不 超 过 
判定 树 的 深度 ， 在 最 坏 情 况 下 查找 成 功 的 比较 次 数 也 不 超过 判定 树 的 深度 ， 因 为 判定 树 中 
度数 小 于 2 的 节点 可 能 在 最 下 面 的 两 层 上 ， 所 以 个 节点 的 判定 树 的 深度 和 个 节点 的 完 
全 二 叉 树 相 同 ， 均 为 [log;(n+1)]。 由 此 可 见 ， 二 分 查找 的 最 坏 性 能 和 平均 性 能 相当 接近 。 
虽然 二 分 查找 的 效率 高 , 但 是 要 将 表 按 关 键 字 排序 。 而 排序 本 身 是 一 种 很 费时 的 运算 ， 
即使 采用 高 效率 的 排序 方法 也 要 花费 O(nlogzan) 的 时 间 。 而 且 二 分 查找 只 适用 于 顺序 存储 结 
构 ， 为 了 保持 表 的 有 序 性 ， 在 顺序 结构 里 插入 和 删除 都 必须 移动 大 量 的 节点 。 因 此 ， 二 分 
查找 特别 适用 于 那 种 一 经 建立 就 很 少 改动 、 而 又 经 常 需要 查找 的 线性 表 。 对 那些 查找 少 又 
经 常 需要 改动 的 线性 表 ， 可 采用 链表 作为 存储 结构 ， 进 行 顺 序 查找 。 


9.2.3 分 块 查找 Ks 


分 块 查找 (Blocking Searchj 又 称 索引 顺序 查找 ， 它 PN E 介 于 顺序 查找 和 二 分 查找 
之 间 的 查找 方法 。 I ea 
性 表 和 索引 表 组 成 。 

RA mat ae mA 前 5-1 块 中 节点 个 数 为 S-[ mb] ， 















































第 b 块 的 节点 数 小 于 等 于 S: 每 一 a 8 定 有 序 ， 但 前 一 块 中 的 最 大 关键 字 必 
须 小 于 后 一 块 中 的 最 小 关键 字 ， 即 表 是 。 AFIA” 的。 
(2) RIR: MRAR h K 键 字 及 其 起 始 位 置 构成 一 个 索引 表 Df] W 























IDLO Si < byi ENS i ee FER FLAK 
有 序 的 ， 所 以 索引 表 是 二 个 递增 有 序 表 。 

图 93 就 是 满足 上 述 存储 要 求 的 分 块 TO 1 有 18 个 节点 ， 被 分 成 三 块 ， 每 
块 中 有 六 个 节点 /第 一 块 中 最 大 关键 字 22 不 于 二 块 中 最 小 关键 字 24， 第 二 块 中 最 大 关 
键 字 48 小 于 中 最 小 关键 字 49。 | 

“* 0 12 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 


rusi [20] 10] 15] 8 | eilet 28] 46 |26 62 [58 ]70]51 [89] 5 
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图 9.3 分 块 有 序 表 的 索引 存储 表示 


分 块 查找 的 基本 思想 ， 先 查找 索引 表 ， 因 为 索引 表 是 有 序 表 ， 故 可 采用 二 分 查找 或 顺 
序 查找 ， 以 确定 待 查 的 节点 在 哪 一 块 ， 然 后 在 已 确定 的 那 一 块 中 进行 顺序 查找 。 
在 如 图 9.3 所 示 的 存储 结构 中 ， 查 找 关 键 字 等 于 给 定 值 K=28 的 节点 ， 因 为 索引 表 小 ， 
不 妨 用 顺序 查找 方法 查找 索引 表 ， 即 首先 将 天 依次 和 索引 表 中 各 关键 字 比较 ， 直 到 找到 第 
一 个 关键 字 大 于 等 于 定 值 K 的 节点 ， 由 于 玉 >20， 继 续 比 较 下 一 个 值 ， 天 <46， 因 此 可 以 
判定 关键 字 为 28 的 节点 车 存在 ， 则 必定 在 第 二 块 中 ; 然后 ， 由 ID[1].addr 找到 第 二 块 的 起 
始 地 址 7， 从 该 地 址 开始 进行 顺序 查找 ， 直 到 R[9].key=K 为 止 。 若 给 定 值 K=30， 类 似 地 ， 




































































数据 结构 (C 语言 版 ) o) 


通过 索引 表 先 确定 在 第 二 块 ， 然 后 在 该 块 中 查找 ， 若 查找 不 成 功 ， 则 说 明 表 中 不 存在 关键 
字 为 30 的 节点 。 
当选 用 二 分 查找 法 查找 索引 表 时 ， 分 块 查找 算法 及 有 关 说 明 如 下 。 





算法 9.3 分 块 查找 算法 。 





由 于 分 块 查找 实际 上 是 两 次 查找 过 程 ， 故 整个 算法 的 平均 查找 长 度 是 两 次 查找 的 平均 
查找 长 度 之 和 。 

(1) 以 三 分 查找 来 确定 块 ， 则 分 块 查找 的 平均 查找 长 度 为 : 

ASLbix=ASLbn+ASLsa~log2(b+1) -1+(s+1)/2~1log>(n/s+l)+s/2 
(2) 以 顺序 查找 确定 块 ， 则 分 块 查找 的 平均 查找 长 度 为 : 
ASL'b=(b+1)/2+(s+1)/2-(s*+2s+n)/(2s) 

当 s=Vn 时 ASL yn SOMA Vn +1， 即 当 采 用 顺序 查找 确定 块 时 ， 应 将 各 块 中 的 节点 
数 选 定 为 n。 例 如 ， 若 表 中 有 10000 个 节点 ， 则 应 把 它 分 成 100 个 块 ， 每 块 中 含 100 个 节 
点 。 用 顺序 查找 确定 块 ， 分 块 查找 平均 需要 做 100 次 比较 ， 而 顺序 查找 平均 需 做 5000 次 比 


er 





较 ， 二 分 查找 最 多 需 14 次 比较 。 由 此 可 见 ， 分 块 查找 算法 的 效率 介 于 顺序 查找 和 二 分 查找 
之 间 。 

在 实际 应 用 中 ， 分 块 查找 不 一 定 要 将 线性 表 分 成 大 小 相等 的 若干 块 ， 而 应 该 根据 表 的 
特征 进行 分 块 。 例 如 ， 一 个 学 校 的 学 生 登 记 表 ， 可 按 系 号 或 班 号 分 块 ， 此 外 ， 各 块 中 的 节 
点 也 不 一 定 要 存放 在 同一 个 数组 中 ， 可 将 各 块 放 在 不 同 的 数组 中 ， 也 可 将 每 一 块 存放 在 一 
个 单 链表 中 。 

分 块 查找 的 优点 : 在 表 中 插入 或 删除 一 个 记录 时 ， 只 要 找到 该 记录 所 属 的 块 ， 即 可 在 
该 块 内 进行 插入 和 删除 运算 ， 而 且 对 表 中 数据 进行 插入 或 删除 比较 容易 ， 无 需 移动 大 量 记 
录 ， 因 为 块 内 记录 的 存放 是 任意 的 。 分 块 查找 的 主要 代价 是 增加 了 一 个 辅助 数组 的 存储 空 
间 和 将 初始 表 分 块 排序 的 运算 。 












































K N) \ 

在 前 面 讨论 的 表示 查找 表 的 各 种 结构 的 共同 特 : 点 是 这 录 企 表 中 的 位 置 和 它 sel 
间 不 存在 确定 的 关系 ， 查找 的 过 程 为 给 定 值 依次 和 关键 学 合 中 各 个 关键 字 进 行 比较 。 
找 的 效率 取决 于 和 给 定 值 进 行 比较 的 关键 FRB, ,用 这 类 方法 表示 的 查找 表 ， Hate 
长 度 都 不 为 0。 不 同 的 表示 方法 的 差别 在 于 :关键 字 和 给 定 值 进行 比较 的 顺序 不 同 。 对 于 
据 繁 使 用 的 查找 表 ， 如 果 希 望 ASL=0, 就 需要 预先 知道 所 查 关键 字 在 表 中 的 位 置 ， 即 要 求 
记录 在 表 中 位 置 和 其 关键 字 之 问 存在 二 种 确定 的 关系 ATAARE RERNE 
的 基本 思想 。 YX 


9.3.1 哈 希 表 的 概念 ~ 


哈 希 法 (Hashing) 是 一 MEEDER we 种 常见 的 查找 方法 。 它 的 基本 思想 如 
下 : 以 节点 的 关键 字 K 为 自 变量 ， 通过 一 个 确定 的 函数 关系 /， 计 算出 对 应 的 函数 值 AK), 
把 这 个 值 解释 为 节点 的 存储 地 址 ， 将 节点 存 入 fAK) 所 指 的 存储 位 置 。 查 找 时 再 根据 要 查找 
4 关键 字 用 同样 的 函数 计算 地 址 ， 然 后 到 相应 的 单元 里 去 取 要 找 的 节点 。 因 此 ， 哈 希 法 又 
称 关键 字 一 一 地 址 转换 法 。 用 哈 希 法 存储 的 线性 表 称 为 哈 希 表 (Hash Table)， 上 述 的 函数 f 
HA Ah RB, RD) 称 为 哈 希 = 

通常 哈 希 表 的 存储 空间 是 一 个 一 维 数组 ， 哈 希 地 址 是 数组 的 下 标 ， 在 不 致 引起 混淆 的 
情况 下 ， 这 个 ‘ALLER a MA 
假如 要 建立 一 张 全国 各 城市 的 人 口 统计 表 ， 如 表 9.1 所 示 。 


表 9.1 全 国人 口 统计 表 


非 农 业 人 口 /万 总 人 口 /万 
904 | 1145 
1174 1309 
419 
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数据 结构 (C 语言 版 ) z ) 


显然 ， 可 以 按 编号 依次 存放 这 张 表 ， 编 号 就 是 记录 的 关键 字 ， 由 它 唯一 确定 记录 的 存 
储 位 置 ， 如 北京 编号 为 1， 要 查看 北京 的 人 口 ， 只 要 取出 第 1 条 记录 即 可 。 如 果 把 这 个 存 
储 方式 看 作 哈 希 表 ， 则 哈 希 函 数 Rkey)=key， 有 A1)=1，h2)=2，…， 为 了 查看 方便 ， 也 可 
以 用 地 区 名 做 关键 字 ， 取 地 区 名 的 第 一 个 拼音 字母 的 序号 做 哈 希 函数 ， 则 有 fbeijing)=2， 
A(chengdu)=3, f(shanghai)=19. 

从 这 个 例子 可 以 看 出 ， 哈 希 函数 是 一 个 映像 ， 即 将 关键 字 的 集合 映射 到 某 个 地 址 集合 
上 ， 它 的 设置 很 灵活 ， 只 要 这 个 地 址 集合 的 大 小 不 超出 允许 范围 即 可 ， 由 于 关键 字 的 值 域 


















































往往 比 哈 希 表 的 个 数 大 很 多 ， 所 以 哈 希 函数 是 一 个 压缩 映像 。 例 如 ， 对 于 如 下 九 个 关键 字 
{Zhao，Qian，Sun，Li，Wu，Chen，Han，Ye，Dai} ， 设 哈 希 函数 : 

Akey)=| (ord( 第 一 个 字符 )-ord( 4)+1)/2|，ord 为 字符 的 次 序 ， 如 ord(“A”)=1， 则 
构建 的 哈 希 表 如 表 9.2 所 示 。 r 
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MER MER TREPI Qian” KNER MU Be ER BOETH OB AQian)=8， 
即 可 从 地 址 为 8 的 表 中 取得 该 记录 。 但 是 , 当 同 时 存在 关键 字 “Zhao” 和 “Zhang” 时 ， 得 
到 AZhao)=13=AZhang)， 这 时 就 产生 了 ” 溃 突 ”。 一 般 来 讲 ， 很 难 找到 一 个 不 产生 冲突 的 哈 
希 函 数 ， 只 能 根据 实际 情况 选择 恰当 的 哈 希 函数 ， 使 冲突 尽 可 能 少 产生 。 因 此 ， 在 构造 这 
种 特殊 的 “查找 表 ” 时 ， 除 子 需要 选择 一 个 “好 ”( 尽 可 能 消 产 生 冲 突 ) 的 哈 希 函数 之 外 ， 
还 需要 找到 一 种 “处 理 冲突 “的 方法 。 XI 

所 以 哈 希 表 可 以 定 艾 如 下 :根据 设 定 的 哈 基 函数 Xkey) 和 所 选中 的 处 理 冲突 的 方法 , 将 
一 组 关键 字 映 像 到 < 外 有 限 的 、 地 址 连续 的 地 址 集 (区 间 ) 上 , 并 以 关键 字 在 地 址 集中 的 “ 像 ” 
作为 相应 记录 在 家 吊 的 存储 位 置 ， 如 此 构造 所 得 的 查找 表 称 为 “ 哈 希 表 ”， 这 一 映像 过 程 也 
称 为 “ 散 列 ”， 所 以 哈 希 表 也 称 为 散 列表 。 


9.3.2” 险 希 表 的 构造 


哈 希 函数 的 种 类 繁多 ， 这 里 不 能 一 一 列举 。 下 面 仅 介绍 几 种 计算 简单 且 效 果 较 好 的 哈 
希 函 数 。 怎 样 什么 才 算 是 好 的 哈 希 函数 呢 ? 有 两 个 原则 可 以 参考 ; 计算 简单 ， 如 果 一 个 算 
法 可 以 保证 所 有 的 关键 字 都 不 会 产生 冲突 ， 但 是 这 个 算法 需要 很 复杂 的 计算 ， 会 耗费 很 多 
时 间 ， 那 么 对 于 需要 频繁 查找 的 表 来 说 ， 就 会 大 大 降低 查找 的 效率 ， 因 此 哈 希 函数 的 计算 
时 间 不 应 该 超过 其 他 查找 技术 与 关键 字 比较 的 时 间 ; 哈 希 地 址 分 布 均匀 ， 即 尽量 让 哈 希 地 
址 均匀 分 布 在 存储 空间 中 ， 保 证 存储 空间 的 有 效 利 用 ， 并 减少 为 处 理 冲 突 而 耗费 的 时 间 。 
为 了 方便 讨论 ， 以 下 均 假 定 关键 字 是 数字 型 的 ， 若 关键 字 是 字符 型 的 ， 则 可 先 将 其 转 
换 成 数值 。 
. 直接 定 址 法 
如 果 现 在 要 统计 0 一 100 岁 的 人 口 数字 ， 如 表 9.3 所 示 ， 那 么 对 年 龄 这 个 关键 字 就 可 以 
直接 用 年 龄 的 数字 作为 地 址 ， 即 hkey)=key。 车 现在 要 统计 的 是 1980 年 后 出 生 的 人 口 数 ， 
























































如 表 9.4 所 示 ， 那 么 对 于 出 生年 份 这 个 关键 字 可 以 用 年 份 减 去 1980 来 作为 地 址 ， 此 时 
.key)=key-1980。 也 就 是 说 ， 可 以 取 关 键 字 的 某 个 线性 函数 值 为 哈 希 地 址 ， 即 











表 9.3 人口 数 字 统 计 表 























地 址 人 数 /万 
00 500 
ol 600 
02 450 
20 1500 

地 址 人 数 / 万 
00 1500 
01 1600 
02 1450 
20 800 


fikey)=aXkeytb (ax b 为 常数 ) X 

这 样 的 哈 希 函数 优点 就 是 简单 ”均匀 ， 也 不 会 产生 冲突 ， 但 是 却 需要 事先 知道 关键 字 
的 分 布 情况 ， 适 合 查找 表 较 小 彝 连 续 的 情况 。 由 于 这 样 的 限制 ， 在 现实 应 用 中 ， 此 方法 虽 
然 简单 ， 却 不 常用 。 

2. 数字 分 析 法 

该 方法 是 提取 关键 字 中 取 值 较 均匀 的 数字 作为 哈 希 地 址 的 方法 。 它 适合 于 所 有 关键 字 
己 知 的 情况 ， 并 需要 对 关键 字 中 每 一 位 的 取 值 分 布 情况 进行 分 析 。 例 如 ， 一 组 关键 字 为 
{87912602，87956671，87937615，8784675}， 分 析 可 知 ， 每 个 关键 字 从 左 到 右 的 第 1、2、 
3 位 和 第 6 位 取 值 比较 集中 ， 不 宜 作为 哈 希 函数 ， 剩 余 的 4、5、7、8 位 取 值 比较 分 散 ， 可 
根据 实际 需要 取 其 中 的 若干 位 作为 哈 希 地 址 。 若 取 最 后 两 位 作为 哈 希 地 址 ， 则 哈 希 地 址 为 
人 

数字 分 析 法 通常 适合 处 理 关 键 字 位 数 比 较 大 的 情况 ， 如 果 事 先知 道 关键 字 的 分 布 且 关 
键 字 的 若干 位 分 布 较 均 匀 ， 就 可 以 考虑 使 用 这 种 方法 。 

3. 平方 取 中 法 

通常 ， 要 预先 估计 关键 字 的 数字 分 布 并 不 容易 ， 要 找 数字 均匀 分 布 的 位 数 则 更 难 。 例 
如 ,一 组 关键 字 (0100，0110.1010，1001，0111) 就 无 法 使 用 数字 选择 法 得 到 入 的 散 列 函 
数 。 此 时 可 采用 平方 取 中 法 ， 即 先 通过 求 关键 字 的 平方 值 扩 大 差别 ， 然 后 取 中 间 的 几 位 或 
其 组 合作 为 哈 希 地 址 。 因 为 一 个 乘积 的 中 间 几 位 数 和 乘 数 的 每 一 位 都 相关 ， 故 由 此 产生 的 
哈 希 地 址 也 较为 均匀 ， 所 取 位 数 由 哈 希 表 的 表 长 决定 。 

例如 , 上述 一 组 关键 字 的 平方 结果 是 (0010000, 0012100, 1020100, 1002001, 0012321), 



































































































数据 结构 (语言 的 ©) 


若 表 长 为 1000， 则 可 取 中 间 三 位 作为 哈 希 地 址 集 : 
(100, 121, 201020, 123) 
平方 取 中 法 比较 适合 不 知道 关键 字 的 分 布 ， 而 位 数 又 不 是 很 大 的 情况 。 
4， 折 枉法 


折 革 法 是 将 关键 字 分 割 成 位 数 相同 的 几 部 分 (最 后 一 部 分 的 位 数 可 以 不 同 )， 然 后 取 它 
们 的 全 加 和 ( 舍 去 进位 ) 为 哈 希 地 址 的 方法 。 折 又 法 又 分 移 位 琶 加 法 和 边界 县 加 法 两 种 。 移 
位 县 加 法 将 分 割 后 的 几 部 分 最 低位 对 齐 ， 然 后 相 加 ;边界 全 加 法 则 从 一 端 沿 着 分 割 边 界 来 
本 折合 ， 然 后 对 齐 相 加 。 例 如 ， 关 键 字 key=0442205864， 按 移 位 合 加 法 和 边界 倒 加 法 计算 
蛤 希 地 址 ， 如 图 9.4 所 示 。 将 此 关键 字 分 成 四 位 一 段 ， 两 种 一 加 结果 如 下 。 
































HAIMA 边界 县 加 法 g 

5864 5864 

4220 it R 
+ 04 

10088 Sin 
Akey)=0088 Yeo 092 


法 示例 

TE oil: er 且 每 一 位 数字 的 分 布 
基本 均匀 的 情况 。 

5， 除 留 余 数 法 ye 

选择 一 个 不 saa kakeun P, N 即 

(9.5) 

该 方法 fain ig 日 范围 大 ， a 和 asian 其 关键 是 选取 
适当 的 P， 如 果 选 择 不 当 ， 容易 产生 较 多 同义词 ， 使 哈 希 表 中 有 较 多 的 冲突 。 

如 表 9.5 所 示 ， 对 有 12 个 记录 的 关键 字 构 造 哈 希 表 时 ， 用 ftkey)=key%12 的 方法 ， 如 
29%12=5， 所 以 它 存储 在 下 标 为 5 的 位 置 。 
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不 过 这 也 有 存在 冲突 的 可 能 ， 如 果 关 键 字 中 有 像 18、30、42 等 数字 ， 它 们 的 余数 都 是 
6， 就 和 78 所 对 应 的 下 标 位 置 冲突 了 。 











此 ， 根 据 理论 研究 ， 若 哈 希 表 表 长 为 m， 通 常 P 为 小 于 或 等 于 表 长 (最 好 接近 四 的 
最 小 质数 或 不 包含 小 于 20 质 因 子 的 合 数 。 
6， 随 机 数 法 
选择 一 个 随机 函数 ， 取 关键 字 的 随机 函数 值 为 它 的 散 列 地 址 ， 即 
flkey)=random (key) (9.6) 
这 里 的 random 为 随机 函数 .通常 , 当 关 键 字 长 度 不 等 时 采用 此 法 构造 散 列 地 址 较 恰当 。 
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© : 
实际 工作 中 需 视 不 同 的 情况 采用 不 同 的 哈 希 函数 。 通 常 需 考虑 的 因素 有 计算 哈 希 函数 
所 需 的 时 间 ( 包 括 硬件 指令 的 因素 )、 关 键 字 的 长 度 、 哈 希 表 的 大 小 、 关 键 字 的 分 布 情况 和 
记录 的 查找 频率 。 


9.3.3 ”解决 冲突 的 方法 


在 险 希 表 中 ， 虽 然 冲突 很 难 避 免 ， 但 是 发 生 冲突 的 可 能 性 却 有 大 有 小 。 这 主要 和 三 个 
素 有 关 。 

(1) 与 装填 因子 有 关 . 装 填 因 子 是 指 哈 希 表 中 已 存 入 的 记录 数 与 哈 希 地 址 空间 大 小 加 
的 比值 ， 即 a=n/m。a 越 小 ， 冲 突 的 可 能 性 就 越 小 ，a 越 大 (最 大 可 能 取 0)， 冲 突 的 可 能 性 
就 越 大 。 因 为 a 越 小 ， 哈 希 表 中 的 空闲 单元 的 比例 就 越 大 ， 所 以 待 插入 记录 同 已 插入 记录 
发 生 冲 突 的 可 能 性 就 越 小 ， 反 之 ， 哈 希 表 中 的 空闲 单元 的 比例 就 越 小 ， 待 插入 记录 同 已 插 
入 记录 发 生 冲突 的 可 能 性 就 越 大 。 此 外 ， a 越 小 ， 存 储 空间 的 利用 率 就 越 低 ， 反 之 利用 率 
ee Rett Oe ns 

D 与 所 采用 的 哈 希 函数 有 关 。 若 哈 希 函数 选择 得 当 ， 就 可 以 使 哈 希 地 址 尽 可 能 均匀 
T 
域 ， 从 而 加 大 冲突 的 产生 。 XX 

O) SAR ARBA ME om I A a I 
生 冲 突 的 可 能 性 。 yS- 

下 面 介绍 处 理 哈 希 冲突 两 大 类 mona. 

1， 开 放 地 址 法 yy XX KK 

reacts SAARE DERN BRN A 
EEFIN, ARAE IEA NEER EREA E AR A — NS 
址 ( 即 该 地 址 元 为 有 ) 为 止 。 若 插入 时 页 到 江 庆 的 地 址 ， 则 可 交待 插 入 新 节点 存放 在 该 地 
址 单元 中 。 若 关 我 时 碰 到 开放 的 地 址 ， 则 说 明 表 中 没有 待 查 的 关键 字 。 显 然 ， 用 开放 地 址 
法 建立 哈 希 表 ， 建 表 前 必须 将 表 空 间 的 所 有 单元 置 空 

形成 探查 序列 的 方法 不 同 ， 所 得 到 的 解决 冲突 的 方法 也 不 相同 。 下 面 介绍 几 种 常用 的 
探查 方法 ， 并 假设 哈 希 表 HT 的 长 度 为 wm， 节点 个 数 为 n。 

D 线性 探查 法 

线性 探查 法 的 基本 思想 : 将 哈 希 表 看 作 一 个 环形 表 。 若 地 址 为 d( 即 HCkey)=q) 的 单元 发 
生 冲突 ， 则 依次 探查 下 述 地 址 单元 
d+1, d+2, **, m-l, 0, l, +, d-1 

直到 找到 一 个 空 单元 或 查找 到 关键 字 为 key 的 节点 为 止 。 当 然 ， 若 沿 着 该 探查 序列 查 
找 一 遍 之 后 ， 又 回 到 了 地 址 4， 则 无 论 是 做 插入 操作 还 是 做 查找 操作 ， 都 意味 着 失败 ( 即 此 
时 表 满 )。 
线性 探查 法 解决 冲突 ， 求 下 一 个 开放 地 址 的 公式 为 

d=(d+i)%m i=l, 2, +, s(1<s<m-1) (9.7) 














































































































StH, d=fikey). 
例如 ， 己 知 一 组 关键 字 为 (26，36，41，38，44，15，68，12，06，51，25)， 用 线性 




















ss | 





数据 结构 (C 语言 版 ) 


Sfikey)=key%13. 














Ç >) 


探查 法 解决 冲突 构造 这 组 关键 字 的 哈 希 表 。 
为 了 减少 冲突 ， 通 常 令 装 填 因 子 <1。 在 此 ， 我 们 取 0.75. 
长 m=15, BING HRA HT[15]。 利 用 除 余 法 构造 哈 希 函数 ， 





| 则 用 式 (9.7) 求 下 一 个 开放 地 址 。 第 一 个 插入 的 是 26， 它 的 哈 希 
故 将 26 插入 HT[0]。 类 似 地 ， 依 次 插入 36，41，38 和 44 时 ， 它 

















们 的 哈 希 地 址 10、2、 


HT[5] 中 。 当 插入 15 时 ， 


因为 这 是 一 个 开放 地 址 ， 
12、5 都 是 开放 的 ， 故 将 它们 分 别 插入 
其 哈 希 地 址 为 d=f5)=2, FP HT[2] 已 被 关键 字 41 占用 ( 即 发 生 

















因为 n=11, MA, MER 
选 P=13， 即 哈 希 函数 为 








插入 时 ， 首 先 用 哈 希 函数 计算 出 散 列 地 址 4， 若 该 地 址 是 开放 的 ， 则 插入 新 节点 ， 否 


也 址 d 为 R26)=26%13=0， 


HT[10]、HT[2]、HT[12] 和 





冲突 ), 故 利用 式 (9.1) 进 行 探查 。 显然 , d=(2+1)%15=3 为 开放 地 


中 。 类 似 地 , 68 和 12 均 经 过 - 


次 探查 下 一 个 地 址 dj=14， 该 地 








它 的 喻 希 地 址 也 是 12, 2 





























-次 探查 后 , 分 别 插入 到 HT[4] 和 HT[3] 中 。06 直接 插入 HT[6]， 
51 的 哈 希 地 址 为 12， 与 HT[12] 中 的 38 发 生 冲突 ， 故 由 式 (9.7) 求 得 ,=13， 仍 然 冲 突 ， 再 
此 是 开放 的 ， 故 将 51 AHTRA 最 后 一 个 插入 的 是 25， 
径 过 了 四 次 探查 di=13, dy=14, d0 dl 之 后 才 找到 开放 地 址 


bk, 因此 , 将 15 插入 HT[3] 





将 25 插入 HT[1]。 由 此 构造 的 哈 希 表 如 表 9.6 MR 其 下 最 未 - 行 的 数字 表示 查找 该 节 








时 所 进行 的 关键 字 比 较 次 数 。 


表 9.6 i 


散 列 地 址 本 1 
f ao po Ts 





EARL EE acs BED Be ere 3 


在 上 例 中 ，X15)=2， 





R683, BU 15 和 68 未 是 同义词， 





于 处 理 15 和 同义词 41 的 








冲突 时 ， 1 抢先 占用 了 HT[3], ALOE AEE 68 时 ， ee 
词 之 间 也 会 发 生 名 突 。 一 般 地 ， 用 线性 探查 法 解决 冲突 时 ， 当 表 中 六 itl, = 人 


已 有 节点 时 ， 一 丫 哈 希 


也 址 为 i， 计 1，…，i+k+1 的 节点 都 将 插入 位 置 itk+1 上 ， 我 们 把 这 


种 哈 希 地 址 不 同 的 节点 , 争夺 同一 个 后 继 哈 希 地 址 的 现象 称 为 “堆积 ”。 这 将 造成 不 是 同 义 


词 的 节点 ， 处 在 同一 个 
或 装填 因子 过 大 ， 都 可 











E 使 堆积 的 机 会 增加 。 


探查 序列 之 中 ， 从 而 增加 了 探查 序列 的 长 度 。 若 哈 希 函数 选择 不 当 


为 了 减少 堆积 的 机 会 ， 就 不 能 像 线性 探查 法 那样 探查 一 个 顺序 的 地 址 序列 ， 而 应 该 使 


探查 序列 跳跃 式 地 散 列 在 整个 哈 希 表 中 。 





探查 法 相 比 ， 它 们 大 大 : 
2) 二 次 探查 法 


二 次 探查 法 的 探查 序列 依次 是 1, 


词 来 回 散 列 在 第 一 个 地 
公式 为 ; 


虽然 二 次 探查 法 减少 了 堆积 的 可 能 





也 减少 了 堆积 的 可 能 性 。 








Dyi1=(d+7 )Yom 
D,=(d-i)Y%om (1<i<(m-1)/2) 





为 此 下 面 介绍 另外 三 种 解决 冲突 的 方法 ， 与 线性 


-1，22，-22，…， 也 就 是 说 ， 发 生 冲 突 时 ， 将 同 义 
引 d=Kkey) 的 两 端 。 由 此 可 知 ， 发 生 冲突 时 ， 求 下 一 个 开放 地 址 的 


(9.8) 





性 , 但 是 二 次 探查 法 不 容易 探查 到 整个 哈 希 表 空 间 。 

















第 9 章 查 找 
© == i 
3) 随机 探查 法 
采用 随机 探查 法 解决 冲突 时 ， 求 下 一 个 开放 地 址 的 公式 为 : 
d=(d+R)%m (1<i<m-l) (9.9) 


SUH, d=flkey), Riv Roy t+ Rite 1, 2 o> m-l 的 一 个 随机 排列 。 如 何 得 到 随机 排列 ， 
涉及 随机 数 的 产生 问题 。 在 实用 中 ， 常 常用 移 位 寄存 器 序列 代替 随机 数 序列 。 设 m 是 2 的 
Ti, KR lom 的 一 个 整数 ， 产 生 移 位 寄存 器 序列 的 方法 如 下 。 

任 取 1 一 "1 的 一 个 整数 作为 Rio 

设 已 知 R o 2 











ý a H2R, <mt 

"|QR_,-m)®K %2R > mitt 
式 中 : 整数 K、m、R,,、R 都 是 二 进 制 表 示 ， 运 算 旬 为 按 位 模 2 加 法 ， 按 位 模 2 加 法 与 普 
通 二 进 制 加 法 类 似 ， 只 是 不 产生 进位 。 Va 

应 当 注 意 , K 必须 选择 合适 才能 产生 出 1 2，…, m-1 的 半 父 随机 排列 。 例 如 ， BE m=8， 
IR K=3，RF5， 则 产生 的 随机 排列 为 5，1，2，4， pee 若 取 K=5， 也 能 产生 1~7 的 
一 个 随机 排列 ， 但 K 取 其 他 值 就 不 能 产生 了 。 xy 
XN 








4) 双重 哈 希 函数 探查 法 SS 
这 种 方法 使 用 两 个 哈 希 函 数 Hi 和 Hs， seb a He 以 关键 字 为 自 变 量 ， 
产生 一 个 0 到 m-1 之 间 的 数 作为 哈 FT 也 以 关键 字 为 自 变量 ， 产 生 一 个 1 到 m-1 


之 间 的 并 和 m 互 素 的 数 作为 对 哈 希 地 址 的 补偿 。 若 Hi(key)=d 时 发 生 冲 突 ， 则 再 计算 
Hykey), SR AINE) ~ y KK 
(d+Hy(key))%m, >  (d+2Hh(key))%m\ d+3Hy(key))%m, ** 
此 可 知 ， 双 哈 希 函数 探查 法 求 下 一 个 开 的 公式 为， 
da(dtit (Key))%m y U: i<m-1) (9.4) 
定义 fala gaint 但 无 论 采用 什么 方法 定义 万 ， 都 必须 使 key HELA m T. 
素 ， 才 能 使 发 生 冲 突 的 同义词 地 址 均匀 地 分 布 在 整个 表 中 ， 否 则 可 能 造成 同义词 地 址 的 循 
环 计算 。 
若 m 为 素数 ， 则 Ho(key)AL 1 一 m-1 的 任何 数 均 与 m 互 素 ， 因 此 ， 我 们 可 以 简单 地 将 
HP 52 UM: 























Hy(key)=key%(m-2)+1 

车 m 是 2 WATE, MW Ho(key) AVAL ! 一 or-1 之 间 的 任何 奇数 。 

2. 拉链 法 

拉链 法 是 将 所 有 具有 相同 哈 希 地 址 的 关键 字 的 值 放 在 同一 个 单 链 表 中 。 若 选 定 的 哈 希 
表 的 长 度 为 m， 则 可 将 散 列表 定义 为 一 个 由 m 个 头 指针 组 成 的 指针 数组 7[m]， 凡 是 哈 希 地 
址 为 i 的 节点 ， 均 插入 到 以 7[i] 为 头 指针 的 单 链表 中 。7T 中 各 分 量 的 初 值 为 空 。 

例如 ,给 定 关键 字 集 合 {26, 36, 41，38，44，15，68，12，06，51}， 取 哈 希 表 长 m=13, 
哈 希 函数 为 fkey)=key%13， 用 拉链 法 解决 冲突 所 构造 出 来 的 哈 希 表 ， 如 图 9.5 所 示 。 


数据 结构 (C 语言 版 ) 





ooo -oo 


srs 








图 9.5 Pi omnes LN 


与 开放 地 址 法 相 比 ， 拉 链 法 有 如 下 几 个 优点 ; maT | 因此 平均 查 
找 长 度 较 短 ， 由 于 拉链 法 中 各 单 链表 上 的 节点 空 | A 申请 的 ， 故 它 更 适合 于 构造 表 前 
无 法 确定 表 长 的 情况 ， 在 用 拉链 法 构造 的 哈 3 除 节点 的 操作 易于 实现 ， 只 要 简单 
地 删 去 链表 上 相应 的 节点 即 可 。 Cs “alps 删除 节点 不 能 简单 地 将 被 
删节 点 的 空间 置 为 空 ， seer ae NR EE UA T RERE, 这 是 因 
为 在 各 种 开放 地 址 法 中 ， 空 地 址 放 地 址 ) 都 是 查找 失败 的 条 件 。 因 此 在 用 开放 地 
址 法 处 理 冲突 oh 上 wee g 删除 标记 ， 而 不 能 真正 删除 
节点 。 Ls 

当 装 填 因 子 较 大 时 ， 拉 链 法 所 用 的 空间 上 ise, 但 是 空间 越 大 ， 开 放 地 址 法 
dione ge Sr 是 合算 的 。 


9.3.4” 险 希 表 查 找 实现 


哈 希 表 的 查找 过 程 和 建 表 过 程 相 一 致 。 假 设 给 定 的 值 为 key， 根 据 建 表 时 设 定 的 哈 希 
函数 /， 计 算出 哈 希 地 址 Rkey)， 若 该 地 址 对 应 的 空间 为 空 几 ， 则 查找 失败 ， 否 则 将 该 地 址 
中 的 节点 与 给 定 值 key 进行 比较 ， 若 值 相 等 则 查找 成 功 ， 否 则 按 建 表 时 设 定 的 处 理 冲 突 方 
法 求 下 一 个 地 址 ， 反 复 进 行 该 步骤 ， 直 到 某 个 地 址 空间 为 空闲 (查找 失败 ) 或 者 关键 字 比较 
相等 (查找 成 功 ) 为 止 。 

下 面 以 线性 探查 法 为 例 ， 给 出 哈 希 表 上 的 查找 和 插入 算法 。 

哈 希 表 类 型 说 明 如 下 。 

#define NIL -1 
#define M 997 
typedef struct{ 















































KeyType key; 
InfoType otherinfo; 
}NodeType; 
Typedef NodeType HashTable[m]; 


算法 9.4 MERKER. 


从 上 述 查 找 过 程 可 知 ， 虽 然 哈 希 表 在 关键 字 和 存储 位 置 之 问 直接 建立 了 对 应 关系 ， 但 
是 ， 由 于 冲突 的 产生 ， 哈 希 表 的 查找 过 程 仍然 是 一 个 和 关键 字 比较 的 过 程 ， 不 过 哈 希 表 的 


平均 查找 长 度 比 顺序 查找 要 小 得 多 ， 比 二 分 查找 长 度 也 小 。 


9 








数据 结构 ( 语言 版 ) 
i -一 


9.4 ”编程 实现 电话 号 码 查询 系统 


采用 哈 希 表 实 现 电话 号 码 查找 系统 ， 并 考虑 解决 哈 希 冲突 的 方法 。 设 每 个 记录 有 电话 
号 码 、 用 户 名 和 地 址 三 个 数据 项 ， 需 要 建立 哈 希 表 存储 记录 。 为 插入 查找 方便 ， 在 创建 哈 
希 表 时 建立 了 两 个 哈 希 表 ， 一 个 以 电话 号 码 作为 关键 字 建立 哈 希 表 ， 另 一 个 以 用 户 名 为 关 
键 字 建 立 哈 希 表 。 

由 于 存储 结构 是 链表 ， 因 此 采用 拉链 法 解决 哈 希 冲突 问题 。 定 义 NUM 型 节点 ， 包 含 
电话 号 码 num， 姓 名 name， 地 址 address 和 指向 下 一 个 节点 的 指针 ， 同 义 词 节点 组 成 一 个 
链表 ， 其 中 所 有 链表 地 址 又 组 成 一 个 数组 。 

(D 数据 类 型 定义 如 下 。 ns 


(2) 主 程序 代码 如 下 。 








数据 结构 ( 语言 版 ) 
一 a 








数据 结构 (C 语言 版 ) 
re a 





ve 独立 实践 


如 果 采 用 开放 定 址 法 来 解决 冲突 ， 则 应 该 如 何 构造 哈 希 表 ? 


小 结 





率 的 衡量 标准 一 一 平均 查找 长 度 。 查 找 过 程 中 的 主要 操作 是 关 : :和 给 定 值 进行 的 比较 ， 
此 以 一 次 查找 所 多 进行 的 比较 次 数 的 期 记 们 作为 查找 太 放 新 这 衡量 标准 ， 即 平均 查找 
长 度 。 K 

A TA AERA MIANA. AN 查找 三 种 方法 ， 如 果 线性 表 是 有 
序 的 ， 那 么 二 分 查找 是 一 种 最 快 的 查找 方法 了 哈 希 表 的 概念 、 构 造 哈 希 函数 和 
处 理 吉 突 的 方法 ， 哈 着 表 方法 是 通过 直接 证 娠 出 节点 的 地 址 建立 哈 希 表 玉 进行 查找 的 ， 不 
t 应 该 根据 问题 的 需要 选 
人 





TO 

















MA 

pÝ Ag ` 5 wa 
Ay) me 
— 填空 题 、| 人 a 

1. 在 数 无 规律 的 线性 表 中 进行 检索 的 最 佳 方法 是 

2， 线 性 有 序 表 (qa1，a;，a3，…，azs@) 是 从 小 到 大 排列 的 ， 对 一 个 给 定 的 值 E， 用 二 分 
法 检索 表 中 与 相等 的 元 素 , 在 查找 不 成 功 的 情况 下 , 最 多 需要 检索 We HA 100 
个 节点 ， 用 二 分 法 查找 时 ， 最 大 比较 次 数 是 

3. 假设 在 有 序 线性 表 a[20] 上 进行 二 分 查找 ， 则 比较 一 次 查找 成 功 的 节点 数 为 1; 比 
较 两 次 查找 成 功 的 节点 数 为 : 比较 四 次 查找 成 功 的 节点 数 为 ， 平均 查找 
长 度 为 

4. 二 分 查找 有 序 表 (4，6，12，20，28，38，50，70，88，100)， 若 查找 表 中 元 素 20， 
它 将 依次 与 表 中 元 素 比较 大 小 。 

5. 在 各 种 查找 方法 中 ， 平 均 查 找 长 度 与 节点 个 数 n 无关 的 查找 方法 是 

6. 哈 希 法 存储 的 基本 思想 是 由 决定 数据 的 存储 地 址 。 

7. 有 一 个 表 长 为 m 的 散 列表 ， 初 始 状态 为 空 ， 现 将 wm< 四 个 不 同 的 关键 码 插入 到 哈 
希 表 中 ， 解 决 冲突 的 方法 是 用 线性 探测 法 。 如 果 这 n 个 关键 码 的 哈 希 地 址 都 相同 ， 则 探测 
的 总 次 数 是 



























































数据 结构 (C 语言 版 ) O) 
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二 、 判 断 题 


1. 二 分 查找 只 能 在 有 序 的 顺序 表 上 进行 而 不 能 在 有 序 链表 上 进行 。 ( 

2. 二 分 查找 的 查找 速度 一 定 比 顺序 查找 法 的 查找 速度 快 。 ( 

3. WA LEA PEFR ISAS EER F AERA is BA AN Ah PIE HY TT E o ( 

4. 有 nn 个 数 存放 在 一 维 数组 4[1…n] 中 ， 进 行 顺 序 查找 时 ， 这 n 个 数 的 排列 有 序 或 无 
( 
( 
( 





Bt a a 


序 其 平均 查找 长 度 不 同 。 
5. 适 于 对 动态 查找 表 进 行 高 效率 查找 的 组 织 结构 是 分 块 有 序 表 。 
6. 在 哈 希 查找 中 ,“ 比 较 ” 操 作 一 般 也 是 不 可 避免 的 。 


i St 




















三 、 选 择 题 
1. 在 表 长 为 的 链表 中 进行 线性 查找 ， 它 的 平均 查找 长 度 为 
A. ASL=n B. RAN 
C. ASL=Vn+1 D. ASL~loga(n 1-1 
2. 用 二 分 查找 法 查找 有 序 表 (4，6，10， 2 AR 50, 70, 88, 100), FERK 
中 元 素 58， 则 它 将 依次 与 表 中 ( ke 失败 。 
A. 20, 70, 30, 50 i pene, 88, 70, 50 
C. 20, 50 fa K . 30, 88, 50 
3. 对 22 个 记录 的 有 序 表 做 二 分 : 当 查 找 失败 时 ， 至 少 需 要 比较 ( ) 次 关键 字 。 
A. 3 Ba 4s > 县: 次 D. 6 
4. 链表 适用 于 ( ARY X K 
A. 顺序 mo ern 


C. 顺序 ， 也 能 二 分 法 r 随机 

5。 要 进行 线性 查找 ， 则 线性 表 @( 下 ji- 要 进行 二 分 查找 ， 则 线性 表 @( 。 ); 要 进 
TAA, WATER). i 

某 顺序 存储 的 表格 ， 其 中 有 90000 个 元 素 ， 己 按 关键 项 的 值 的 上 升 顺序 排列 。 现 假定 
对 各 个 元 素 进行 查找 的 概率 是 相同 的 ， 并 且 各 个 元 素 的 关键 项 的 值 名 不 相同 。 当 用 顺序 查 
找 法 查找 时 ， 平 均 比 较 次 数 约 为 @(  )， 最 大 比较 次 数 为 6( ) 

供 选 择 的 答案 : 

@~@，A， 必 须 以 顺序 方式 存储 B. 必须 以 链表 方式 存储 
必须 以 散 列 方式 存储 
既 可 以 以 顺序 方式 ， 也 可 以 以 链表 方式 存储 
必须 以 顺序 方式 存储 且 数 据 元 素 已 按 值 递增 或 递减 的 次 序 排 好 
必须 以 链表 方式 存储 且 数 据 元 素 已 按 值 递增 或 递减 的 次 序 排 好 
@, ©: A. 25000 B. 30000 C. 45000 D. 90000 
ee. O ) @ ) ©) @( ) OH ) 
6. 与 其 他 查找 方法 相 比 ， 哈 希 查找 法 的 特点 是 ( )- 

A. 通过 关键 字 的 比较 进行 查找 

B. 通过 关键 字 计 算 元 素 的 存储 地 址 进行 查找 
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amo 


Q a 查 K 
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C. 通过 关键 字 计 算 元 素 的 存储 地 址 并 进行 一 定 的 比较 进行 查找 





D. 以 上 都 不 是 
7. 静态 查找 表 与 动态 查找 表 的 根本 区 别 在 于 ( )o 
A. 它们 的 逻辑 结构 不 一 样 B. 施加 在 其 上 的 操作 不 一 样 
C. 所 包含 的 数据 元 素 类 型 不 一 样 。”“D. 存储 实现 不 一 样 
四 、 简 答题 


1. 二 分 查找 适 不 适合 链表 结构 的 序列 , 为 什么 ? 用 二 分 查找 法 的 查找 速度 必然 比 线性 
查找 的 速度 快 ， 这 种 说 法 对 吗 ? 
2. 假定 对 有 序 表 (3，4，5，7，24，30，42，54，63，72，87，95) 进 行 二 分 查找 ， 试 





























可 答 下 列 问题 : AR 
(1) 画 出 描述 二 分 查找 过 程 的 判定 树 。 XK 
(2) 若 查找 元 素 54， 需 依次 与 哪些 元 素 比较 ? i 
(3) 若 查找 元 素 90， 需 依次 与 哪些 元 素 比较 ? E 
O 假定 每 个 元 素 的 查找 概率 相等 ， 求 查找 的 平均 查找 长 度 。 
3， 设 哈 希 表 的 地 址 范围 为 0 一 17， 哈 H(K)=K mod 16. 
K 为 关键 字 ， 用 线性 探测 法 再 散 R, 输入 关键 字 序列 : 

(10, 24, 32, 7S, 30, 46, A 49) 

构造 哈 希 表 ， 试 回答 下 列 问 A 
(1) 画 出 哈 希 表 的 示意 图 -全 XXX 
(2) 若 查找 关键 字 63 需要 依次 与 哪些 关 We 
O HERRERO, MERKS 比较 ? 


(4) 假定 每 处 关键 字 的 查找 概率 相等 ， 求 查找 成 功 时 的 平均 查找 长 度 。 

4. 编写 一 个 算法 ， 利 用 二 分 查找 算法 在 一 个 有 序 表 中 插入 一 个 元 素 x， 并 保持 表 的 有 
序 性 。 

5. 选取 哈 希 函数 H(key)=(3*key)%11， 用 线性 探测 法 处 理 冲 突 ， 对 下 列 关 键 码 序列 构造 
一 个 散 列 地 址 空间 为 0 一 10， 表 长 为 11 HIRATA, {22, 41, 53, 08, 46, 30, 01, 31, 66}. 
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23 17-301-12177-1| 现 代 通信 系统 | 6o |7-301-12380-5 | 电子 测量 与 传 感 技术 35 
24 |7.301-12340-9| 异 拟 电子 技术 | 61 |7-301-14461-9| 高 电压 技术 AKI] 28 
25 |7-301-13121-3| 异 拟 电子 技 术 多 62 |7-301-14472-5 家 m EA RRN Hwen 25 
MATLAB. 
26 17-301-11502-2| 移 动 通信 郭 俊 强 | 22 | 63 17-301-14460-2 上 电力 系统 分 析 t 娜 | 35 
27 |7-301-11504-6 梅 开 乡 | 30 f 64 17-301-14459-6|DSP 技术 与 应 用 基础 俞 一 彪 | 34 
28 |7-301-18860-6}2 % 吴 亚 丽 | 28 | 65_|7-301-14994-2 FR tr Mi ER HEME BRE 达 金 | 24 
29 |7-5038-4407-2| 传 感 器 与 检测 技术 祝 诗 平 | 30 | 66 |7-301-15168-6| 信 号 处 理 MATLAB 实验 杰 | 20 
30 |7-5038-4413-3| 单 片 机 原理 及 应 用 刘刚 | 24 f 67 |7-301-15440-3| 电 工 电子 伟 | 26 
31 |7-5038-4409-6| 电 机 与 拖 动 杨 天 明 | 27 | 68 |7-301-15445-8 瞪 测 与 控制 伟 | 24 
32 |7-5038-4411-9| 电 力 电子 技术 HO] 25 f 69 |7-301-04595-4| 电 路 与 模拟 电子 技术 张 绪 光 | 35 
33 |7-5038-4399-0| 电 力 市 场 原理 与 实践 a8 R| 24 | 70 7301188888) i o PEE: 印 德 润 | 70 
34 |7-5038-4405-8| 电 力 双 71 |7-301-15786-2[ 通 信和 网 的 信 令 系统 IKRE] 24 
35 |7-5038-4397-6| 电 力 系统 自动 化 72 |7-301-16493-8| 发 电厂 变 电 所 电气 部 分 马 永 翔 | 35 
36 |7-5038-4404-1| 电 气 控制 技术 73 [7-301-16076-3 B F15 ALEE =a 
37 |7-5038-4403-4| 电 器 与 PLC 控制 技术 74_|7-301-16931-5 [MHAE RIHAR 

















序号 | 标准 书号 $ 4 主 编 | 定价 | 序号 | 标准 书号 | 
75 |7-301-16932-2) FEAR 刘 金 华 | 30 | 110 |7-301-20845-8 eae ae ! 技 术 实验 
76 |730116933-9 卜 动 控制 原理 本 a| 32 [ami | 301-20725-3 emera 


4 机 原 应 实验 
77 |7-301-17540-8| 单 片 机 原理 及 应 用 教程 周 广 兴 | 40 | 112 |7-301-21058-1 样片 机 慰 理 与 应 用 及 其 实 驳 


























HSE 
78 [7-301-17614-6 机 全 的 和 和 2 | 113 7T.30120918.9| me EER SREE aoe] 30 
79 |7-301-12379-9| 光 纤 i 卢 志 茂 | 28 | 114 |7-301-20327-9| 电 工学 实验 教程 王 土 军 | 34 
80_|7-301-17382-4| 离 散 信息 论 其 础 范 九 伦 | 25 f 115 |7-301-16367-2| 供 配 电 技术 王 玉 华 | 49 





电路 与 模拟 电子 技术 实验 摘 | 


8 与 分 布 式 发 电 技术 [AKG] 32 | 116 |-301- -20351-4 Jes, 


7-301-17677-1 [iii fied 











82_|7-301-17683-2ptFi 
83 |7-301-17700-6| 模 拟 电子 技术 

RM 嵌入 式 系统 基础 与 开 | 
发 教程 

原理 及 应 用 


26 | 117 [7-301-21247-9 MATLAB 基础 与 应 用 教程 | 于 月 明 | 32 
36 | 118 [7-301-21235-6 | 集成 电路 版 图 设计 陆 学 斌 | 36 


丁 文 龙 | 36 f 119 [7-301-21304-9 数字 电子 技术 EKHE | 49 
-301-21366-7 | 电力 系统 继 电 保护 (第 2 版) [IKM | 42 











84 |7-301-17318-3 





85 |7-301-17797-6| 



























86 [7-301-17986-4 [7-301-21450-3 刁 拟 电子 与 数字 好 辑 legen | 39 
87_|7-301-18131-7 [7 ESH | 42 
88 |7-301-18285-7| 电 子 线路 CAD. FER | 49 
89 |7-301-16739-7IMATLAB 基础 及 应 用 Hint | 36 
90 |7-301-18352-6| 信 息 论 与 编码 fE A ARR HART Aly a | 30 
化 教程 
出 电机 与 特种 电机 及 其 单片机 系统 设计 与 实例 开发 | P 
91 [7-301-18260-4 h og (MSP430) m | 4 


92 |7-301-18493-6| 电 工 技术 

93 |7-301-18496-7| 现 代 电 子 系统 设计 教程 
94 |7-301-18672-5| 太 阳 能 电池 原理 与 应 用 
95 17-301-18314-4| 通 信 电 子 线 路 及 仿真 设计 
96 17-301-19175-0| 单 片 机 原理 与 接口 技术 
97 |7-301-19320-4| 移 动 通 信 ， 
98 [7-301-19447-8 | 电气 信息 类 专业 
99 |7-301-19451-5| 殿 入 式 系统 设计 及 应 用 
电子 信息 类 专业 MATLAB 
100 |7-301-19452-2| ott 

101 |7-301-16914-8 坪 理光 学 理论 与 应 用 | 
102 |7-301-16598-0| 综 合 布线 系统 管理 教程 
103 |7-301-20394-1| 掀 联网 基础 与 应 用 

104 17-301-20339-2 | 数字 图 像 处 理 


许 丽 佳 | 30 
if 胜 | 39 
李 文 书 | 48 
EAN HH 






















j7301-22484-7| 文 化 一 
物 联 网 技术 案例 教程 
钱 裕 禄 | 30 
|7-301-22529-5|pLC 技术 ! 与 应 用 (西门 子 生 ) 丁 爹 婷 | 32 
|7-301-22386-4| 自 z fe 威 | 30 

8. WES 34 
i 佳 | 38 




















105 |7-301-20340-8| 信 号 与 系统 140 |7-301-22447-2 fiit. ah fi] 35 
106 |7-301-20505-1| 电 路 分 析 基 础 38 | 141 |7-301-22776-3| 信 和 号 朱 明 早 | 33 
107 |7-301-22447-2| 腾 入 式 系统 基础 实践 教程 _| 韩 _ 磊 | 35 f 142 |7-301 万 芳 瑛 | 34 












































108 |7-301-20506-8| 编 码 调制 技术 黄平 | 26 f 143 17-301-22882-1|IMCS-51 机 原理 及 应 用 [BEARER] 34 
109 |7-301-20763-5| 网 络 工程 与 管理 谢 E| 39 7-301-22936-1| 自 动 控制 原理 邢 春芳 | 39 
MRR ellie 教材 、 习题 答案 等 可 以 Se aes 下 载 或 在 线 阅读 。 





习题 、 辅导 材料 、 课 改 成 果 、 

itt 论文 等 教学 MERN sre “ej BENT 9) 的 教学 成 就 与 经 验 ， 并 可 自由 设 定 
价格 ， 知 识 也 能 创造 财富 。 具 体 情 况 请 登录 网 站 查询 。 
需要 免费 纸 质 样 书 用 于 教学 ， 欢 迎 登 陆 第 六 事业 部 门户 网 (www.pup6.com) 填 表 申 请 ， 并 欢迎 在 线 登 
选 题 以 到 北京 大 学 出 版 社 来 出 版 您 的 大 作 ， 也 可 下 载 相关 表格 填写 后 发 到 我 们 的 邮箱 ,我 们 将 及 时 与 您 DAR 
系 并 做 好 全 方位 的 服务 。 

扑 六 知识 网 将 打造 成 全 国 最 大 的 教育 资源 共享 平台 ， 欢 迎 您 的 加 入 一 一 让 知识 有 价值 ， 让 教学 无 界限 ， 让 
学 习 更 轻松 。 

联系 方式 : 010-62750667，pup6_czq@163.com，szheng_pup6@163.com，linzhangbo@126.com， 欢 迎 
来 电 来 信 咨 询 。 












